fix

Superjomn · Superjomn · commit 0b82b35e1c37 · 2025-07-16T09:56:35.000+08:00
Signed-off-by: Superjomn &lt;328693+Superjomn@users.noreply.github.com&gt;
diff --git a/tensorrt_llm/llmapi/llm_args.py b/tensorrt_llm/llmapi/llm_args.py
@@ -2014,8 +2014,13 @@ def validate_cuda_graph_config(self) -> 'TorchLlmArgs':
 
     @model_validator(mode='after')
     def sync_quant_config_with_kv_cache_config_dtype(self) -> 'TorchLlmArgs':
+        if self.kv_cache_config is None:
+            return self
+
         assert self.quant_config is not None
-        if self.kv_cache_config.dtype == 'fp8':
+        if self.kv_cache_config.dtype == "auto":
+            return self
+        elif self.kv_cache_config.dtype == 'fp8':
             self.quant_config.kv_cache_quant_algo = QuantAlgo.FP8
         else:
             logger.warning(