Releases · wejoncy/QLLM · GitHub

23 Mar 04:47

v0.2.3.1 Latest

Latest

What's Changed

ci: add PyPI deploy stage with manual approval by @wejoncy in #174
docs: update README for CUDA 13.0, Python 3.11-3.13 by @wejoncy in #175
fix: parallel_download_decorator compatible with transformers >= 5 by @wejoncy in #176
Bump version to 0.2.3.1 by @wejoncy in #177

Full Changelog: v0.2.3...v0.2.3.1

Contributors

wejoncy

Assets 8

21 Mar 07:41

v0.2.3

What's Changed

enhance vptq by @wejoncy in #158
patch parallel download shard by @wejoncy in #159
fix vptq cache dir and model name by @wejoncy in #160
add log by @wejoncy in #161
fix moe hessian by @wejoncy in #162
[vptq] fix caching by @wejoncy in #163
[dataset] fix torch load by @wejoncy in #164
[vptq] support save and load by @wejoncy in #165
fix local checkpoint loading by @wejoncy in #167
reduce memory usage during repack by @ReinForce-II in #168
fix: compatibility with transformers >= 5 and support non-llama models in chat plugin by @wejoncy in #171
Bump version to 0.2.3 by @wejoncy in #172
fix: CI build - ubuntu-22.04, MSVC setup for Windows by @wejoncy in #173

New Contributors

@ReinForce-II made their first contribution in #168

Full Changelog: v0.2.2.1...v0.2.3

Contributors

wejoncy and ReinForce-II

Assets 8

24 Jan 05:58

v0.2.2.1

What's Changed

add more example on colab by @wejoncy in #153
fix colab params by @wejoncy in #154
urgent fix by @wejoncy in #155
urgent 0.2.2.post by @wejoncy in #156
urgent 0.2.2.1 by @wejoncy in #157

Full Changelog: v0.2.2...v0.2.2.1

Contributors

wejoncy

Assets 8

23 Jan 10:41

v0.2.1

What's Changed

more Awq models && onnx kernel bug when g=-1 by @wejoncy in #138
feat: support new quantization algorithm 'Vptq' by @wejoncy in #141
vptq: polish vptq config by @wejoncy in #142
bump to 0.2.1 by @wejoncy in #143
fix package by @wejoncy in #144
fix ci by @wejoncy in #145
support auto dtype by @wejoncy in #146
quick fix by @wejoncy in #147
fix package name by @wejoncy in #148

Full Changelog: v0.2.0...v0.2.1

Contributors

wejoncy

Assets 8

26 Aug 12:40

v0.2.0

What's Changed

fix llama3.1 by @wejoncy in #132
support transformers-lib loading by @wejoncy in #134
bump to 0.2.0 by @wejoncy in #135

Full Changelog: v0.1.9.1...v0.2.0

Contributors

wejoncy

Assets 18

02 Jul 09:28

v0.1.9.1

What's Changed

add assert message && ci upgrade torch 2.2.2 by @wejoncy in #124
Update README.md by @wejoncy in #125
fix version match erros by @wejoncy in #128
add macro GENERAL_TORCH to get rid of OptionalCUDAGuard by @wejoncy in #129
quick fix by @wejoncy in #130
v0.1.9.1 by @wejoncy in #131

Full Changelog: v0.1.9...v0.1.9.1

Contributors

wejoncy

Assets 18

19 Jun 08:11

v0.1.9

What's Changed

Bump to 0.1.8 by @wejoncy in #109
new autogptq config format && parallel load by @wejoncy in #110
bugfix by @wejoncy in #111
fix issue by @wejoncy in #113
Fix 112 by @wejoncy in #114
Fix typos by @emphasis10 in #115
minor fix, attn_implementation by @wejoncy in #120
Bump to 0.1.9 by @wejoncy in #121
-allow-unsupported-compiler by @wejoncy in #122

New Contributors

@emphasis10 made their first contribution in #115

Full Changelog: v0.1.8...v0.1.9

Contributors

wejoncy and emphasis10

Assets 18

21 Mar 06:00

v0.1.8

What's Changed

Update README.md by @wejoncy in #102
buf fix. by @wejoncy in #103
Onnx fix qzeros odd-shape by @wejoncy in #104
Refactor by @wejoncy in #105
support MARLIN pack_mode by @wejoncy in #106
support awq sym by @wejoncy in #107
Refactor by @wejoncy in #108

Full Changelog: v0.1.7.1...v0.1.8

Contributors

wejoncy

Assets 18

09 Mar 15:30

v0.1.7.1

What's Changed

fix "disable win in release by @wejoncy in #98
minor fix and dataset speed by @wejoncy in #99
minor fix by @wejoncy in #100
patch release v0.1.7.1 by @wejoncy in #101

Full Changelog: v0.1.7...v0.1.7.1

Contributors

wejoncy

Assets 18

08 Mar 10:44

v0.1.7

What's Changed

ort ops support in main branch with act_order by @wejoncy in #92
support export hqq to onnx by @wejoncy in #93
Bump to 0.1.7 by @wejoncy in #94
improve .cpu() with non_blocking by @wejoncy in #95
disable win in release by @wejoncy in #96
refactor args by @wejoncy in #97

Full Changelog: v0.1.6...v0.1.7

Contributors

wejoncy

Assets 10