Skip to content

模拟量化导出的模型包括量化参数吗 #472

@artificialzjy

Description

@artificialzjy

问题描述:

  1. modelopt_cuda_ext的作用是什么?可以自己调整modelopt_cuda_ext回落到CPU上计算吗?
  2. 我尝试了对Llama-3-8B模拟量化,模型权重量化前后的权重大小没变,请问模拟量化还会保存哪些信息或者参数呢?
  3. 模拟量化后的模型部署到推理框架(vLLM、SGLang)时,是如何进行量化的?

Metadata

Metadata

Assignees

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions