vllm-project · wangxiyuan · May 6, 2026 · May 2, 2026 · gemini-code-assist · May 2, 2026
@@ -300,6 +300,7 @@ async def _wrapped_chat_completion_stream_generator(
     tokenizer,
     request_metadata: engine_protocol.RequestResponseMetadata,
     reasoning_parser=None,
+    **extra_kwargs: Any,
 ):
     num_choices = 1 if request.n is None else request.n
     state = _create_usage_tracking_state(num_choices, reasoning_parser)
@@ -314,6 +315,7 @@ async def _wrapped_chat_completion_stream_generator(
         tokenizer,
         request_metadata,
         reasoning_parser,
+        **extra_kwargs,
     ):
         yield _inject_stream_usage_details(data, state)