b6121

Latest

Latest

github-actions released this 09 Aug 04:24

e54d41b

gguf-py : add Numpy MXFP4 de/quantization support (#15111)

* gguf-py : add MXFP4 de/quantization support

* ggml-quants : handle zero amax for MXFP4

Assets 15