Support zero-point decompression for asymmetric quantization (packed compressor)

When using asymmetric quantization with PackedQuantizationCompressor, zero-points are packed during compression but were not unpacked during decompression. This prevented loading and inference for models using GROUP or CHANNEL strategies.

This tracks the feature request in vllm-project/llm-compressor#1704 and proposes adding zero-point unpack support in decompress_weight.

References:
- vllm-project/llm-compressor#1704 (https://github.com/vllm-project/llm-compressor/issues/1704)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Support zero-point decompression for asymmetric quantization (packed compressor) #458

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Support zero-point decompression for asymmetric quantization (packed compressor) #458

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions