sgl-project · AniZpZ · Dec 17, 2025 · Nov 19, 2025 · Nov 19, 2025 · Nov 20, 2025
@@ -62,7 +62,6 @@ def apply_fp8_marlin_linear(
         a=reshaped_x,
         c=None,
         b_q_weight=weight,
-        b_bias=bias,
         b_scales=weight_scale,
         global_scale=None,
         b_zeros=None,
@@ -77,6 +76,9 @@ def apply_fp8_marlin_linear(
         use_fp32_reduce=use_fp32_reduce,
     )
 
+    if bias is not None:
+        output.add_(bias)
+
     return output.reshape(out_shape)