MatMulLowering::LoweringBF16 缺少 do_relu 条件判断，LoweringF16 有，建议修复

使用 W8BF16 量化模型后，发现导出后的 tpu-mlir 缺少了 relu 算子，因为 MatMulLowering::LoweringBF16 没有处理 `do_relu=true` 的情况。LoweringF16 处理了这个条件，暂时将 W8BF16 切换为 W8F16 避免这个问题。

https://github.com/sophgo/tpu-mlir/blob/a20df037a8342b9eaf0aabfcaa04d56059aea5f1/lib/Conversion/TopToTpu/BM1684X/MatMul.cpp#L729-L742

	if (true == op.getDoRelu()) {
	auto name = module::getName(op->getResult(0));
	auto matmul_loc =
	NameLoc::get(rewriter.getStringAttr(name.str() + "_a16matmul"));
	auto a16matmul_op = rewriter.create<tpu::A16MatMulOp>(
	matmul_loc, newType, operands, attrs);
	std::vector<NamedAttribute> relu_attrs;
	auto relu_limit =
	rewriter.getNamedAttr("relu_limit", op.getReluLimitAttr());
	relu_attrs.push_back(relu_limit);
	rewriter.replaceOpWithNewOp<tpu::ReluOp>(
	op, newType, ValueRange{a16matmul_op.getOutput()}, relu_attrs);
	return;
	}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

MatMulLowering::LoweringBF16 缺少 do_relu 条件判断，LoweringF16 有，建议修复 #251

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

MatMulLowering::LoweringBF16 缺少 do_relu 条件判断，LoweringF16 有，建议修复 #251

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions