[Quantization] Add ModelOpt NVFP4 W4A16 (4-bit weights, fp16/bf16 activations) support#41769

Merged

pavanimajety merged 19 commits into

vllm-project:mainfrom

juhi10071998:w4a16_modelopt_support

May 9, 2026

Meta CodeSync / Meta Internal-Only Changes Check succeeded May 9, 2026 in 0s

There is no internal Diff connected, this can be merged now

View more details on Meta CodeSync