Fix matmul_4bit gemv path for mismatched quant_state layout by datavorous · Pull Request #1906 · bitsandbytes-foundation/bitsandbytes

datavorous · 2026-03-29T10:49:54Z

Problem: gemv fast path in matmul_4bit assumes quant_state.shape follows (out_features, in_features), and can silently produce wrong output shape/values for transposed layout metadata.

Fix: add a minimal shape guard in matmul_4bit vector fast path; on mismatch, fall back to MatMul4Bit.apply.

Scope: no kernel changes, no API changes, minimal 2-line guard.

Fix matmul_4bit gemv path for mismatched quant_state layout

4aaf727

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Fix matmul_4bit gemv path for mismatched quant_state layout#1906

Fix matmul_4bit gemv path for mismatched quant_state layout#1906
datavorous wants to merge 1 commit intobitsandbytes-foundation:mainfrom
datavorous:fix/matmul4bit-gemv-shape-guard

datavorous commented Mar 29, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Uh oh!

Conversation

datavorous commented Mar 29, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant