pytorch
diff --git a/‎examples/qualcomm/custom_op/custom_ops_fast_gelu.py‎
Lines changed: 266 additions & 0 deletions b/‎examples/qualcomm/custom_op/custom_ops_fast_gelu.py‎
Lines changed: 266 additions & 0 deletions
diff --git a/‎examples/qualcomm/custom_op/example_op_package_htp/ExampleOpPackage/Makefile‎
Lines changed: 31 additions & 5 deletions b/‎examples/qualcomm/custom_op/example_op_package_htp/ExampleOpPackage/Makefile‎
Lines changed: 31 additions & 5 deletions
@@ -0,0 +1,266 @@
+# Copyright (c) Qualcomm Innovation Center, Inc.
+# All rights reserved.
+#
+# SPDX-License-Identifier: BSD-3-Clause
+
+"""
+Example: Custom FastGELU operator integrated with ExecuTorch Qualcomm backend (HTP).
+"""
+
+import json
+import os
+import subprocess
+import sys
+from multiprocessing.connection import Client
+
+import numpy as np
+import torch
+
+from executorch.backends.qualcomm.quantizer.quantizer import QuantDtype
+from executorch.backends.qualcomm.serialization.qc_schema import (
+    _soc_info_table,
+    HtpArch,
+    QcomChipset,
+    QnnExecuTorchOpPackageInfo,
+    QnnExecuTorchOpPackageOptions,
+    QnnExecuTorchOpPackagePlatform,
+    QnnExecuTorchOpPackageTarget,
+)
+from executorch.examples.qualcomm.utils import (
+    build_executorch_binary,
+    generate_inputs,
+    make_output_dir,
+    make_quantizer,
+    setup_common_args_and_variables,
+    SimpleADB,
+)
+from torch.library import impl, Library
+
+# ------------------------------------------------------------------------------
+# 1. Register PyTorch custom operator (FastGELU)
+# ------------------------------------------------------------------------------
+
+my_op_lib = Library("my_ops", "DEF")
+my_op_lib.define("fast_gelu(Tensor input) -> Tensor")
+
+
+@impl(my_op_lib, "fast_gelu", "CompositeExplicitAutograd")
+def fast_gelu_impl(x: torch.Tensor) -> torch.Tensor:
+    return 0.5 * x * (1.0 + torch.tanh(0.7978845608 * (x + 0.044715 * x * x * x)))
+
+
+# registering the out variant.
+my_op_lib.define(
+    "fast_gelu.out(Tensor input, *, Tensor(a!) output) -> Tensor(a!)"
+)  # should print 'fast_gelu.out'
+
+
+# ------------------------------------------------------------------------------
+# 2. Simple model using custom op
+# ------------------------------------------------------------------------------
+
+
+class Model(torch.nn.Module):
+    def forward(self, a):
+        return torch.ops.my_ops.fast_gelu.default(a)
+
+
+# ------------------------------------------------------------------------------
+# 3. Build + register custom op package
+# ------------------------------------------------------------------------------
+
+
+def _run(cmd, cwd=None):
+    subprocess.run(cmd, stdout=sys.stdout, cwd=cwd, check=True)
+
+
+def prepare_op_package(
+    workspace: str, op_package_dir: str, arch: HtpArch, build_op_package: bool
+):
+    if build_op_package:
+        _run(["rm", "-rf", "build"], cwd=op_package_dir)
+        _run(["make", "htp_x86", "htp_aarch64", f"htp_v{arch}"], cwd=op_package_dir)
+        _run(
+            [
+                "cp",
+                f"{op_package_dir}/build/hexagon-v{arch}/libQnnFastGeluOpPackage.so",
+                f"{op_package_dir}/build/hexagon-v{arch}/libQnnFastGeluOpPackage_HTP.so",
+            ]
+        )
+
+    op_package_paths = [
+        f"{op_package_dir}/build/hexagon-v{arch}/libQnnFastGeluOpPackage_HTP.so",
+        f"{op_package_dir}/build/aarch64-android/libQnnFastGeluOpPackage.so",
+    ]
+
+    op_package_infos_HTP = QnnExecuTorchOpPackageInfo()
+    op_package_infos_HTP.interface_provider = "FastGeluOpPackageInterfaceProvider"
+    op_package_infos_HTP.op_package_name = "FastGeluOpPackage"
+    op_package_infos_HTP.op_package_path = f"{workspace}/libQnnFastGeluOpPackage_HTP.so"
+    op_package_infos_HTP.target = QnnExecuTorchOpPackageTarget.HTP
+    op_package_infos_HTP.custom_op_name = "my_ops.fast_gelu.default"
+    op_package_infos_HTP.qnn_op_type_name = "FastGelu"
+    op_package_infos_HTP.platform = QnnExecuTorchOpPackagePlatform.AARCH64_ANDROID
+    op_package_infos_aarch64_CPU = QnnExecuTorchOpPackageInfo()
+    op_package_infos_aarch64_CPU.interface_provider = (
+        "FastGeluOpPackageInterfaceProvider"
+    )
+    op_package_infos_aarch64_CPU.op_package_name = "FastGeluOpPackage"
+    op_package_infos_aarch64_CPU.op_package_path = (
+        f"{workspace}/libQnnFastGeluOpPackage.so"
+    )
+    op_package_infos_aarch64_CPU.target = QnnExecuTorchOpPackageTarget.CPU
+    op_package_infos_aarch64_CPU.custom_op_name = "my_ops.fast_gelu.default"
+    op_package_infos_aarch64_CPU.qnn_op_type_name = "FastGelu"
+    op_package_infos_aarch64_CPU.platform = (
+        QnnExecuTorchOpPackagePlatform.AARCH64_ANDROID
+    )
+    op_package_infos_x86_CPU = QnnExecuTorchOpPackageInfo()
+    op_package_infos_x86_CPU.interface_provider = "FastGeluOpPackageInterfaceProvider"
+    op_package_infos_x86_CPU.op_package_name = "FastGeluOpPackage"
+    op_package_infos_x86_CPU.op_package_path = (
+        f"{op_package_dir}/build/x86_64-linux-clang/libQnnFastGeluOpPackage.so"
+    )
+    op_package_infos_x86_CPU.target = QnnExecuTorchOpPackageTarget.CPU
+    op_package_infos_x86_CPU.custom_op_name = "my_ops.fast_gelu.default"
+    op_package_infos_x86_CPU.qnn_op_type_name = "FastGelu"
+    op_package_infos_x86_CPU.platform = QnnExecuTorchOpPackagePlatform.X86_64
+    op_package_options = QnnExecuTorchOpPackageOptions()
+    op_package_options.op_package_infos = [
+        op_package_infos_x86_CPU,
+        op_package_infos_aarch64_CPU,
+        op_package_infos_HTP,
+    ]
+
+    return op_package_options, op_package_paths
+
+
+# ------------------------------------------------------------------------------
+# 4. Entrypoint — same pattern as custom_ops_1.py
+# ------------------------------------------------------------------------------
+
+
+def main(args):
+    if args.build_op_package:
+        if "HEXAGON_SDK_ROOT" not in os.environ:
+            raise RuntimeError("Environment variable HEXAGON_SDK_ROOT must be set")
+        print(f"HEXAGON_SDK_ROOT={os.getenv('HEXAGON_SDK_ROOT')}")
+
+        if "ANDROID_NDK_ROOT" not in os.environ:
+            raise RuntimeError("Environment variable ANDROID_NDK_ROOT must be set")
+        print(f"ANDROID_NDK_ROOT={os.getenv('ANDROID_NDK_ROOT')}")
+
+    # ensure the working directory exist.
+    os.makedirs(args.artifact, exist_ok=True)
+
+    quant_dtype = QuantDtype.use_8a8w
+    if args.use_fp16:
+        quant_dtype = None
+
+    instance = Model()
+    sample_input = (torch.randn(1, 128),)
+    pte_filename = "fastgelu_model"
+    workspace = f"/data/local/tmp/executorch/{pte_filename}"
+    soc_info: SocInfo = _soc_info_table[getattr(QcomChipset, args.model)]
+
+    op_package_options, op_package_paths = prepare_op_package(
+        workspace,
+        args.op_package_dir,
+        soc_info.htp_info.htp_arch,
+        args.build_op_package,
+    )
+    # quantizer = make_quantizer(
+    #     quant_dtype=quant_dtype, custom_annotations=(annotate_custom,)
+    # )
+
+    build_executorch_binary(
+        instance,
+        sample_input,
+        args.model,
+        f"{args.artifact}/{pte_filename}",
+        sample_input,
+        op_package_options=op_package_options,
+        # quant_dtype=quant_dtype,
+        # custom_quantizer=quantizer,
+    )
+
+    if args.compile_only:
+        sys.exit(0)
+
+    output_data_folder: LiteralString = os.path.join(args.artifact, "outputs")
+
+    adb = SimpleADB(
+        qnn_sdk=os.getenv("QNN_SDK_ROOT"),
+        build_path=args.build_folder,
+        pte_path=f"{args.artifact}/{pte_filename}.pte",
+        workspace=workspace,
+        device_id=args.device,
+        host_id=args.host,
+        soc_model=args.model,
+    )
+    adb.push(inputs=sample_input, files=op_package_paths)
+    adb.execute()
+    adb.pull(output_path=args.artifact)
+
+    # Compare results
+    x86_golden = model(*sample_input)
+    import numpy as np
+
+    device_output = torch.from_numpy(
+        np.fromfile(
+            os.path.join(output_data_folder, "output_0_0.raw"), dtype=np.float32
+        )
+    ).reshape(x86_golden.size())
+    print(
+        "is_close?",
+        torch.all(torch.isclose(x86_golden, device_output, atol=1e-2)).item(),
+    )
+
+
+if __name__ == "__main__":
+    parser = setup_common_args_and_variables()
+    parser.add_argument(
+        "-a",
+        "--artifact",
+        help="path for storing generated artifacts by this example. Default ./custom_op",
+        default="./custom_op",
+        type=str,
+    )
+
+    parser.add_argument(
+        "-d",
+        "--op_package_dir",
+        help="Path to operator package which generates from QNN.",
+        type=str,
+        required=True,
+    )
+
+    parser.add_argument(
+        "-F",
+        "--use_fp16",
+        help="If specified, will run in fp16 precision and discard ptq setting",
+        action="store_true",
+        default=False,
+    )
+
+    parser.add_argument(
+        "--build_op_package",
+        help="Build op package based on op_package_dir. Please set up "
+        "`HEXAGON_SDK_ROOT` and `ANDROID_NDK_ROOT` environment variable. "
+        "And add clang compiler into `PATH`. Please refer to  Qualcomm AI Engine "
+        "Direct SDK document to get more details",
+        action="store_true",
+        default=False,
+    )
+
+    args = parser.parse_args()
+    args.validate(args)
+
+    try:
+        main(args)
+    except Exception as e:
+        if args.ip and args.port != -1:
+            with Client((args.ip, args.port)) as conn:
+                conn.send(json.dumps({"Error": str(e)}))
+        else:
+            raise Exception(e)
@@ -44,19 +44,23 @@ $(info "HEXAGON_SDK_ROOT is [${HEXAGON_SDK_ROOT}]")
 HEXAGON_SDK_ROOT_V68 := $(HEXAGON_SDK_BASE)/hexagon-sdk-4.2.0
 HEXAGON_SDK_ROOT_V69 := $(HEXAGON_SDK_BASE)/hexagon-sdk-4.3.0
 HEXAGON_SDK_ROOT_V73 := $(HEXAGON_SDK_BASE)/hexagon-sdk-5.4.0
-HEXAGON_SDK_ROOT_V75 := $(HEXAGON_SDK_BASE)/hexagon-sdk-5.4.0
-HEXAGON_SDK_ROOT_V79 := $(HEXAGON_SDK_BASE)/hexagon-sdk-6.0.0
+# HEXAGON_SDK_ROOT_V75 := $(HEXAGON_SDK_BASE)/hexagon-sdk-5.4.0
+HEXAGON_SDK_ROOT_V75 := $(HEXAGON_SDK_BASE)
+# HEXAGON_SDK_ROOT_V79 := $(HEXAGON_SDK_BASE)/hexagon-sdk-6.0.0
+HEXAGON_SDK_ROOT_V79 := $(HEXAGON_SDK_BASE)
 
 #Updated to point to latest sdk to match with libQnnHtp.so
-HEXAGON_SDK_ROOT_X86 := $(HEXAGON_SDK_BASE)/hexagon-sdk-6.0.0
+HEXAGON_SDK_ROOT_X86 := $(HEXAGON_SDK_BASE)
 HEXAGON_TOOLS_VERSION_V68 := 8.4.09
 HEXAGON_TOOLS_VERSION_V69 := 8.5.03
 HEXAGON_TOOLS_VERSION_V73 := 8.6.02
 HEXAGON_TOOLS_VERSION_V75 := 8.7.03
-HEXAGON_TOOLS_VERSION_V79 := 8.8.02
+# HEXAGON_TOOLS_VERSION_V79 := 8.8.02
+HEXAGON_TOOLS_VERSION_V79 := 8.8.06
 
 #Updated to point to latest sdk to match with libQnnHtp.so
-HEXAGON_TOOLS_VERSION_X86 := 8.8.02
+# HEXAGON_TOOLS_VERSION_X86 := 8.8.02
+HEXAGON_TOOLS_VERSION_X86 := 8.8.06
 
 ifndef ANDROID_NDK_ROOT
 ifeq ($(MAKECMDGOALS),htp_aarch64)
@@ -87,6 +91,8 @@ COMMON_CXX_FLAGS += -DQNN_API="__attribute__((visibility(\"default\")))"  -D__QA
 
 X86_LIBNATIVE_RELEASE_DIR := $(HEXAGON_SDK_ROOT_X86)/tools/HEXAGON_Tools/$(HEXAGON_TOOLS_VERSION_X86)/Tools
 
+$(info "HEXAGON_SDK_ROOT_X86 is [${HEXAGON_SDK_ROOT_X86}]")
+
 # Ensure hexagon sdk tool version can be retrieved
 ifeq ($(wildcard $(X86_LIBNATIVE_RELEASE_DIR)/.),)
 $(error "Cannot retrieve hexagon tools from: $(X86_LIBNATIVE_RELEASE_DIR).  \
@@ -119,6 +125,8 @@ $(error "ERROR: HEXAGON_SDK_ROOT_V75 is set incorrectly. Cannot retrieve $(HEXAG
 endif
 endif
 
+$(info "HEXAGON_SDK_ROOT_V79 is [${HEXAGON_SDK_ROOT_V79}]")
+
 #Check tools for hexagon_v79 are present.
 ifeq ($(MAKECMDGOALS),htp_v79)
 ifeq ($(wildcard $(HEXAGON_SDK_ROOT_V79)),)
@@ -165,6 +173,7 @@ ifeq ($(shell $(X86_CXX) -v 2>&1 | grep -c "clang version"), 0)
   X86_CXX := clang++
 endif
 X86_LDFLAGS:= -Wl,--whole-archive -L$(X86_LIBNATIVE_RELEASE_DIR)/libnative/lib -lnative -Wl,--no-whole-archive -lpthread
+
 X86_C_FLAGS := -D__HVXDBL__ -I$(X86_LIBNATIVE_RELEASE_DIR)/libnative/include -ffast-math -DUSE_OS_LINUX
 X86_CXX_FLAGS = $(COMMON_CXX_FLAGS) $(X86_C_FLAGS) -fomit-frame-pointer -Wno-invalid-offsetof
 linux_objs =
@@ -178,12 +187,29 @@ HEXAGON_CXX_FLAGS_V73 := $(HEXAGON_CXX_FLAGS) -mv73 -I$(HEXAGON_SDK_ROOT_V73)/rt
 HEXAGON_CXX_FLAGS_V75 := $(HEXAGON_CXX_FLAGS) -mv75 -I$(HEXAGON_SDK_ROOT_V75)/rtos/qurt/computev75/include/qurt -I$(HEXAGON_SDK_ROOT_V75)/rtos/qurt/computev75/include/posix -I$(HEXAGON_SDK_ROOT_V75)/incs -I$(HEXAGON_SDK_ROOT_V75)/incs/stddef
 HEXAGON_CXX_FLAGS_V79 := $(HEXAGON_CXX_FLAGS) -mv79 -I$(HEXAGON_SDK_ROOT_V79)/rtos/qurt/computev79/include/qurt -I$(HEXAGON_SDK_ROOT_V79)/rtos/qurt/computev79/include/posix -I$(HEXAGON_SDK_ROOT_V79)/incs -I$(HEXAGON_SDK_ROOT_V79)/incs/stddef
 
+$(info "HEXAGON_TOOLS_VERSION_V68 is [${HEXAGON_TOOLS_VERSION_V68}]")
+$(info "HEXAGON_TOOLS_VERSION_V69 is [${HEXAGON_TOOLS_VERSION_V69}]")
+$(info "HEXAGON_TOOLS_VERSION_V73 is [${HEXAGON_TOOLS_VERSION_V73}]")
+$(info "HEXAGON_TOOLS_VERSION_V75 is [${HEXAGON_TOOLS_VERSION_V75}]")
+$(info "HEXAGON_TOOLS_VERSION_V79 is [${HEXAGON_TOOLS_VERSION_V79}]")
+
+$(info "HEXAGON_SDK_ROOT_V68 is [${HEXAGON_SDK_ROOT_V68}]")
+$(info "HEXAGON_SDK_ROOT_V69 is [${HEXAGON_SDK_ROOT_V69}]")
+$(info "HEXAGON_SDK_ROOT_V73 is [${HEXAGON_SDK_ROOT_V73}]")
+$(info "HEXAGON_SDK_ROOT_V75 is [${HEXAGON_SDK_ROOT_V75}]")
+$(info "HEXAGON_SDK_ROOT_V79 is [${HEXAGON_SDK_ROOT_V79}]")
+
 HEXAGON_CXX_V68 := $(HEXAGON_SDK_ROOT_V68)/tools/HEXAGON_Tools/$(HEXAGON_TOOLS_VERSION_V68)/Tools/bin/hexagon-clang++
 HEXAGON_CXX_V69 := $(HEXAGON_SDK_ROOT_V69)/tools/HEXAGON_Tools/$(HEXAGON_TOOLS_VERSION_V69)/Tools/bin/hexagon-clang++
 HEXAGON_CXX_V73 := $(HEXAGON_SDK_ROOT_V73)/tools/HEXAGON_Tools/$(HEXAGON_TOOLS_VERSION_V73)/Tools/bin/hexagon-clang++
 HEXAGON_CXX_V75 := $(HEXAGON_SDK_ROOT_V75)/tools/HEXAGON_Tools/$(HEXAGON_TOOLS_VERSION_V75)/Tools/bin/hexagon-clang++
 HEXAGON_CXX_V79 := $(HEXAGON_SDK_ROOT_V79)/tools/HEXAGON_Tools/$(HEXAGON_TOOLS_VERSION_V79)/Tools/bin/hexagon-clang++
 
+$(info "HEXAGON_CXX_V68[2] is [${HEXAGON_CXX_V68}]")
+$(info "HEXAGON_CXX_V69[2] is [${HEXAGON_CXX_V69}]")
+$(info "HEXAGON_CXX_V73[2] is [${HEXAGON_CXX_V73}]")
+$(info "HEXAGON_CXX_V75[2] is [${HEXAGON_CXX_V75}]")
+$(info "HEXAGON_CXX_V79[2] is [${HEXAGON_CXX_V79}]")
 
 HEX_LDFLAGS =
 hexagon_objs =