vllm-project · michalkuligowski · Feb 26, 2026 · Feb 21, 2026 · Feb 21, 2026 · Feb 21, 2026
@@ -40,5 +40,7 @@ def register_ops():
 
 def register_models():
     import vllm_gaudi.models.interfaces  # noqa: F401
+    import vllm_gaudi.models.bert  # noqa: F401
+    import vllm_gaudi.models.roberta  # noqa: F401
     from .models import register_model
     register_model()
@@ -0,0 +1,26 @@
+import torch
+from vllm.sequence import IntermediateTensors
+from vllm.model_executor.models.bert import TOKEN_TYPE_SHIFT, BertForSequenceClassification
+
+
+def patched_BertForSequenceClassification_forward(
+    self,
+    input_ids: torch.Tensor | None,
+    positions: torch.Tensor,
+    intermediate_tensors: IntermediateTensors | None = None,
+    inputs_embeds: torch.Tensor | None = None,
+    token_type_ids: torch.Tensor | None = None,
+) -> torch.Tensor:
+    if token_type_ids is not None:
+        assert self.bert.config.vocab_size < (1 << TOKEN_TYPE_SHIFT)
+        assert input_ids is not None
+
+    return self.bert(
+        input_ids=input_ids,
+        positions=positions,
+        inputs_embeds=inputs_embeds,
+        intermediate_tensors=intermediate_tensors,
+    )
+
+
+BertForSequenceClassification.forward = patched_BertForSequenceClassification_forward
@@ -0,0 +1,28 @@
+import torch
+from vllm.sequence import IntermediateTensors
+from vllm.model_executor.models.bert import TOKEN_TYPE_SHIFT
+from vllm.model_executor.models.roberta import RobertaForSequenceClassification, replace_roberta_positions
+
+
+def patched_RobertaForSequenceClassification_forward(
+    self,
+    input_ids: torch.Tensor | None,
+    positions: torch.Tensor,
+    intermediate_tensors: IntermediateTensors | None = None,
+    inputs_embeds: torch.Tensor | None = None,
+    token_type_ids: torch.Tensor | None = None,
+) -> torch.Tensor:
+    replace_roberta_positions(input_ids=input_ids, position_ids=positions, padding_idx=self.padding_idx)
+    if token_type_ids is not None:
+        assert self.roberta.config.vocab_size < (1 << TOKEN_TYPE_SHIFT)
+        assert input_ids is not None
+
+    return self.roberta(
+        input_ids=input_ids,
+        positions=positions,
+        inputs_embeds=inputs_embeds,
+        intermediate_tensors=intermediate_tensors,
+    )
+
+
+RobertaForSequenceClassification.forward = patched_RobertaForSequenceClassification_forward