[https://nvbugs/5648685][fix] Fix openAI server waiting time to avoid large model weight loading out time (NVIDIA#9254)

dominicshanshan · mikeiovine · commit 68643c5701ad · 2025-11-20T13:19:21.000-08:00
Signed-off-by: Wangshanshan &lt;30051912+dominicshanshan@users.noreply.github.com&gt;
diff --git a/tests/unittest/llmapi/apps/openai_server.py b/tests/unittest/llmapi/apps/openai_server.py
@@ -16,7 +16,7 @@
 
 class RemoteOpenAIServer:
     DUMMY_API_KEY = "tensorrt_llm"
-    MAX_SERVER_START_WAIT_S = 600  # wait for server to start for 600 seconds
+    MAX_SERVER_START_WAIT_S = 7200  # wait for server to start for 7200 seconds (~ 2 hours) for LLM models weight loading
 
     def __init__(self,
                  model: str,