vllm-project · laudney · Mar 22, 2026 · gemini-code-assist · Mar 22, 2026 · gemini-code-assist
@@ -552,9 +552,9 @@ def _supports_current_device() -> bool:
         cap = p.get_device_capability()
         if cap is None:
             return False
-        # (9,0) <= cap < (11,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
-        # and ROCm gfx942/gfx950 (which map to 9.4/9.5).
-        return (9, 0) <= (cap.major, cap.minor) < (11, 0)
+        # (9,0) <= cap < (13,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
+        # and ROCm gfx942/gfx950 (9.4/9.5) + gfx1200/gfx1201 (12.0).
+        return (9, 0) <= (cap.major, cap.minor) < (13, 0)
-        # (9,0) <= cap < (13,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
-        # and ROCm gfx942/gfx950 (9.4/9.5) + gfx1200/gfx1201 (12.0).
-        return (9, 0) <= (cap.major, cap.minor) < (13, 0)
+        # (9,0) <= cap < (11,0) or cap.major == 12 covers CUDA SM90 (Hopper),
+        # SM100+ (Blackwell), ROCm gfx942/gfx950 (9.4/9.5), and gfx12 (RDNA4).
+        return (9, 0) <= (cap.major, cap.minor) < (11, 0) or cap.major == 12
-        # (9,0) <= cap < (13,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
-        # and ROCm gfx942/gfx950 (9.4/9.5) + gfx1200/gfx1201 (12.0).
-        return (9, 0) <= (cap.major, cap.minor) < (13, 0)
+        # (9,0) <= cap < (11,0) or cap.major == 12 covers CUDA SM90 (Hopper),
+        # SM100+ (Blackwell), ROCm gfx942/gfx950 (9.4/9.5), and gfx12 (RDNA4).
+        return (9, 0) <= (cap.major, cap.minor) < (11, 0) or cap.major == 12
 
     @staticmethod
     def _supports_no_act_and_mul() -> bool:
@@ -884,9 +884,9 @@ def _supports_current_device() -> bool:
         cap = p.get_device_capability()
         if cap is None:
             return False
-        # (9,0) <= cap < (11,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
-        # and ROCm gfx942/gfx950 (which map to 9.4/9.5).
-        return (9, 0) <= (cap.major, cap.minor) < (11, 0)
+        # (9,0) <= cap < (13,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
+        # and ROCm gfx942/gfx950 (9.4/9.5) + gfx1200/gfx1201 (12.0).
+        return (9, 0) <= (cap.major, cap.minor) < (13, 0)
-        # (9,0) <= cap < (13,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
-        # and ROCm gfx942/gfx950 (9.4/9.5) + gfx1200/gfx1201 (12.0).
-        return (9, 0) <= (cap.major, cap.minor) < (13, 0)
+        # (9,0) <= cap < (11,0) or cap.major == 12 covers CUDA SM90 (Hopper),
+        # SM100+ (Blackwell), ROCm gfx942/gfx950 (9.4/9.5), and gfx12 (RDNA4).
+        return (9, 0) <= (cap.major, cap.minor) < (11, 0) or cap.major == 12
-        # (9,0) <= cap < (13,0) covers CUDA SM90 (Hopper), SM100+ (Blackwell)
-        # and ROCm gfx942/gfx950 (9.4/9.5) + gfx1200/gfx1201 (12.0).
-        return (9, 0) <= (cap.major, cap.minor) < (13, 0)
+        # (9,0) <= cap < (11,0) or cap.major == 12 covers CUDA SM90 (Hopper),
+        # SM100+ (Blackwell), ROCm gfx942/gfx950 (9.4/9.5), and gfx12 (RDNA4).
+        return (9, 0) <= (cap.major, cap.minor) < (11, 0) or cap.major == 12
 
     @staticmethod
     def _supports_no_act_and_mul() -> bool:

@@ -202,7 +202,7 @@ def select_mxfp4_moe_backend(
     triton_kernels_supported = has_triton_kernels() and (
         9,
         0,
-    ) <= current_platform.get_device_capability() < (11, 0)
+    ) <= current_platform.get_device_capability() < (13, 0)
 
     # LoRA: separate experts backend path
     if config.is_lora_enabled: