sgl-project · sunxxuns · Dec 9, 2025 · gemini-code-assist · Dec 9, 2025
diff --git a/python/sglang/lang/backend/runtime_endpoint.py b/python/sglang/lang/backend/runtime_endpoint.py
@@ -281,13 +281,17 @@ def select(
 
         # Remove extra token if no token healing occurred
         for i in range(len(input_token_logprobs)):
+            # Skip if no logprobs available (can happen on some backends)
+            if not input_token_logprobs[i] or not input_token_logprobs[i][0]:
+                continue
             healed_token_str = input_token_logprobs[i][0][-1]
             if s.text_.endswith(healed_token_str):
                 healed_token_logprob = input_token_logprobs[i][0][0]
-                normalized_prompt_logprobs[i] = (
-                    normalized_prompt_logprobs[i] * len(input_token_logprobs[i])
-                    - healed_token_logprob
-                ) / (len(input_token_logprobs[i]) - 1)
+                num_tokens = len(input_token_logprobs[i])
+                if num_tokens > 1:
+                    normalized_prompt_logprobs[i] = (
+                        normalized_prompt_logprobs[i] * num_tokens - healed_token_logprob
+                    ) / (num_tokens - 1)
-                if num_tokens > 1:
-                    normalized_prompt_logprobs[i] = (
-                        normalized_prompt_logprobs[i] * num_tokens - healed_token_logprob
-                    ) / (num_tokens - 1)
+                if num_tokens > 1:
+                    normalized_prompt_logprobs[i] = (
+                        normalized_prompt_logprobs[i] * num_tokens - healed_token_logprob
+                    ) / (num_tokens - 1)
+                else:
+                    normalized_prompt_logprobs[i] = float("-inf")
-                if num_tokens > 1:
-                    normalized_prompt_logprobs[i] = (
-                        normalized_prompt_logprobs[i] * num_tokens - healed_token_logprob
-                    ) / (num_tokens - 1)
+                if num_tokens > 1:
+                    normalized_prompt_logprobs[i] = (
+                        normalized_prompt_logprobs[i] * num_tokens - healed_token_logprob
+                    ) / (num_tokens - 1)
+                else:
+                    normalized_prompt_logprobs[i] = float("-inf")
                 input_token_logprobs[i] = input_token_logprobs[i][1:]
 
         # Compute unconditional logprobs if required
@@ -349,6 +353,9 @@ def _assert_success(self, res):
 
 def compute_normalized_prompt_logprobs(input_logprobs):
     values = [x[0] for x in input_logprobs if x[0]]
+    if not values:
+        # Return negative infinity if no valid logprobs - this choice should not be selected
+        return float("-inf")
     return sum(values) / len(values)