[Model Runner V2] Do not error on attention backends by WoosukKwon · Pull Request #32820 · vllm-project/vllm

WoosukKwon · 2026-01-22T00:37:56Z

No description provided.

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

gemini-code-assist

Code Review

This pull request removes a hardcoded check in GPUModelRunner that restricted the supported attention backends to FLASH_ATTN, FLASHINFER, and FLASHINFER_MLA. By deleting this validation, the model runner becomes more generic and can now accommodate other attention backends. This change is consistent with the removed TODO comment which indicated the need to support more backends. The modification is clean, correct, and improves the flexibility of the system. I approve this change.

) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> Signed-off-by: mohammad najafi <mohammad.najafi@amd.com>

) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> Signed-off-by: 陈建华 <1647430658@qq.com>

) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

[Model Runner V2] Do not error on attention backends

b15ed0f

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

mergify Bot added the v1 label Jan 22, 2026

gemini-code-assist Bot reviewed Jan 22, 2026

View reviewed changes

njhill approved these changes Jan 22, 2026

View reviewed changes

WoosukKwon merged commit 5e00b56 into main Jan 22, 2026
12 of 13 checks passed

WoosukKwon deleted the woosuk/v2-attn-backends branch January 22, 2026 01:02

monajafi-amd pushed a commit to monajafi-amd/vllm that referenced this pull request Jan 23, 2026

[Model Runner V2] Do not error on attention backends (vllm-project#32820

0c751b9

) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> Signed-off-by: mohammad najafi <mohammad.najafi@amd.com>

izhuhaoran mentioned this pull request Jan 23, 2026

[Model Runner V2] support auto resolve cudagraph mode/sizes based on attn backend #32936

Merged

cwazai pushed a commit to cwazai/vllm that referenced this pull request Jan 25, 2026

[Model Runner V2] Do not error on attention backends (vllm-project#32820

5cab5f6

) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> Signed-off-by: 陈建华 <1647430658@qq.com>

lapy pushed a commit to lapy/vllm that referenced this pull request Jan 27, 2026

[Model Runner V2] Do not error on attention backends (vllm-project#32820

a7ebc56

) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[Model Runner V2] Do not error on attention backends#32820

[Model Runner V2] Do not error on attention backends#32820
WoosukKwon merged 1 commit intomainfrom
woosuk/v2-attn-backends

WoosukKwon commented Jan 22, 2026

Uh oh!

gemini-code-assist Bot left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Uh oh!

Conversation

WoosukKwon commented Jan 22, 2026

Uh oh!

gemini-code-assist Bot left a comment

Choose a reason for hiding this comment

Code Review

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants