vllm-project · kylesayrs · May 3, 2026 · May 3, 2026
@@ -352,7 +352,6 @@ def compressor_kv_score() -> torch.Tensor:
                 return torch.mm(
                     hidden_states,
                     compressor.fused_wkv_wgate.weight.T,
-                    out_dtype=torch.float32,
                 )
 
             aux_fns[0] = compressor_kv_score
@@ -369,7 +368,6 @@ def indexer_compressor_kv_score() -> torch.Tensor:
                 return torch.mm(
                     hidden_states,
                     indexer.compressor.fused_wkv_wgate.weight.T,
-                    out_dtype=torch.float32,
                 )
 
             aux_fns[1] = indexer_weights_proj