NVIDIA-NeMo · terrykong · Feb 14, 2026 · Feb 13, 2026 · Feb 13, 2026
@@ -539,7 +539,14 @@ def _get_raw_spec_counters(self) -> dict[str, float | list[float]]:
         """
         metrics: dict[str, float | list[float]] = {}
         if self.llm is not None:
-            for metric in self.llm.get_metrics():
+            if hasattr(self.llm, "get_metrics"):
+                vllm_prom_metrics = self.llm.get_metrics()
+            else:
+                # The AsyncLLM API does not implement get_metrics so we need to call the prometheus API ourselves
+                from vllm.v1.metrics.reader import get_metrics_snapshot
+
+                vllm_prom_metrics = get_metrics_snapshot()
+            for metric in vllm_prom_metrics:
                 if hasattr(metric, "values"):
                     metrics[metric.name] = metric.values
                 elif hasattr(metric, "value"):

@@ -27,6 +27,7 @@ uv run coverage run -a --data-file=$PROJECT_ROOT/tests/.coverage --source=$PROJE
     policy.train_micro_batch_size=1 \
     policy.generation.colocated.enabled=false \
     policy.generation.colocated.resources.gpus_per_node=1 \
+    policy.generation.vllm_cfg.async_engine=true \
     cluster.gpus_per_node=2 \
     grpo.max_num_steps=2 \
     logger.tensorboard_enabled=true \