fix num_heads_q

FENP · FENP · commit 62de2ea2323d · 2025-10-09T12:11:12.000+08:00
Signed-off-by: yuanyongjie.yyj &lt;yuanyongjie.yyj@antgroup.com&gt;
Signed-off-by: FENP &lt;32334296+FENP@users.noreply.github.com&gt;
diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
@@ -317,7 +317,7 @@ def schedule(
                     batch_size=batch_size,
                     max_seqlen_q=max_query_len,
                     max_seqlen_k=max_seq_len,
-                    num_heads_q=self.num_heads_q,
+                    num_heads_q=self.num_heads_q * self.dcp_world_size,
                     num_heads_kv=self.num_heads_kv,
                     headdim=self.headdim,
                     cache_seqlens=seqlens,