[QNN EP] Optimize Session Creation Time #26628

chunghow-qti · 2025-11-21T09:23:58Z

Description

qnn::utils::TwoDimensionTranspose makes the bottleneck during session creation, because there is a double for loop memcpy. If the weight is quite large, it will be very slow. And it's called a total of 3 times by ReshapeGemmFusion.

QnnModel::ComposeGraph → ReshapeGemmFusion::AddToModelBuilder → CreateOrValidateOnQnn → qnn::utils::TwoDimensionTranspose
QNNExecutionProvider::GetCapability → QNNExecutionProvider::GetSupportedNodes → ReshapeGemmFusion::IsSupported → CreateOrValidateOnQnn → qnn::utils::TwoDimensionTranspose (do QNN OP validation)
QNNExecutionProvider::GetCapability → QNNExecutionProvider::GetSupportedNodes → onnxruntime::qnn::ReshapeGemmFusion::IsSupported → CreateOrValidateOnQnn → qnn::utils::TwoDimensionTranspose (do QNN OP validation)

This change avoid heavy memcpy by using a dummy tensor when only shape validation is required.

Motivation and Context

Function	TwoDimensionTranspose_1	TwoDimensionTranspose_2	TwoDimensionTranspose_3	SessionCreationTime
original	88.39 ms	57.80 ms	53.09 m	9.41871 s
avoid 2 memcpy	51.52 ms	12.00 m	8.05 ms	9.05975 s

[QNN EP] optimize session creation time

ca256da

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[QNN EP] Optimize Session Creation Time #26628

[QNN EP] Optimize Session Creation Time #26628

Uh oh!

chunghow-qti commented Nov 21, 2025 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

[QNN EP] Optimize Session Creation Time #26628

Are you sure you want to change the base?

[QNN EP] Optimize Session Creation Time #26628

Uh oh!

Conversation

chunghow-qti commented Nov 21, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Description

Motivation and Context

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

chunghow-qti commented Nov 21, 2025 •

edited

Loading