ROCm
diff --git a/‎dnn-providers/hipblaslt-provider/README.md‎
Lines changed: 4 additions & 0 deletions b/‎dnn-providers/hipblaslt-provider/README.md‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎dnn-providers/hipblaslt-provider/docs/OperationSupport.md‎
Lines changed: 25 additions & 0 deletions b/‎dnn-providers/hipblaslt-provider/docs/OperationSupport.md‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎dnn-providers/hipblaslt-provider/integration_tests/IntegrationGpuMatmul.cpp‎
Lines changed: 6 additions & 5 deletions b/‎dnn-providers/hipblaslt-provider/integration_tests/IntegrationGpuMatmul.cpp‎
Lines changed: 6 additions & 5 deletions
diff --git a/‎dnn-providers/hipblaslt-provider/integration_tests/IntegrationGraphVerificationHarness.hpp‎
Lines changed: 1 addition & 1 deletion b/‎dnn-providers/hipblaslt-provider/integration_tests/IntegrationGraphVerificationHarness.hpp‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎dnn-providers/miopen-provider/integration_tests/IntegrationGpuBatchnormBackward.cpp‎
Lines changed: 17 additions & 21 deletions b/‎dnn-providers/miopen-provider/integration_tests/IntegrationGpuBatchnormBackward.cpp‎
Lines changed: 17 additions & 21 deletions
diff --git a/‎dnn-providers/miopen-provider/integration_tests/IntegrationGpuBatchnormBackwardActivation.cpp‎
Lines changed: 10 additions & 14 deletions b/‎dnn-providers/miopen-provider/integration_tests/IntegrationGpuBatchnormBackwardActivation.cpp‎
Lines changed: 10 additions & 14 deletions
diff --git a/‎dnn-providers/miopen-provider/integration_tests/IntegrationGpuBatchnormForwardInference.cpp‎
Lines changed: 9 additions & 11 deletions b/‎dnn-providers/miopen-provider/integration_tests/IntegrationGpuBatchnormForwardInference.cpp‎
Lines changed: 9 additions & 11 deletions
@@ -10,3 +10,7 @@ This plugin is built as a standalone plugin. To build the plugin, first install
 1. Make a build directory using `mkdir build && cd build`.
 1. Configure the build using `cmake -DCMAKE_CXX_COMPILER=<path to amdclang>/clang++ ..`.
 1. Finally, run `ninja` to build the plugin.
+
+## Operation support
+
+The list of supported operations is described in [Operation Support](docs/OperationSupport.md) documentation.
@@ -0,0 +1,25 @@
+# hipBLASLt Provider Plugin - Operation Support
+
+This document provides detailed information about the operations supported by the hipBLASLt Provider Plugin for hipDNN.
+
+For general information about hipDNN's operation support, please see the [hipDNN Operation Support](../../../projects/hipdnn/docs/OperationSupport.md) documentation.
+
+## Current Operation Support
+
+hipBLASLt Provider Plugin currently supports only stand-alone Matmul (GEMM, general matrix multiplication) operations with the following features and constraints:
+- Input and output data types: FP32, FP16, BF16
+- Compute data type: FP32
+- Transposed inputs: supported
+- Batched matmuls: only equal batch sizes are supported, or broadcasting when one input has a single batch (batch=1)
+
+## Notes
+
+> [!NOTE]
+> **Fused Operations:** Currently the kernel provider doesn't support any fusions.
+
+## Legend
+
+### Datatypes
+- **FP16**: Half-precision floating point (16-bit)
+- **BFP16**: Brain floating point (16-bit)
+- **FP32**: Single-precision floating point (32-bit)
@@ -5,6 +5,7 @@
 #include <random>
 
 #include <hip/hip_runtime.h>
+#include <hipdnn_data_sdk/types.hpp>
 #include <hipdnn_data_sdk/utilities/PlatformUtils.hpp>
 #include <hipdnn_test_sdk/utilities/CpuFpReferenceValidation.hpp>
 #include <hipdnn_test_sdk/utilities/TestTolerances.hpp>
@@ -26,7 +27,7 @@ template <typename DataType>
 class IntegrationGpuMatmul : public IntegrationGraphVerificationHarness<DataType, MatmulTestCase>
 {
 protected:
-    void runGraphTest(DataType tolerance) override
+    void runGraphTest(float tolerance) override
     {
         const MatmulTestCase& testCase = this->GetParam();
 
@@ -73,8 +74,8 @@ class IntegrationGpuMatmul : public IntegrationGraphVerificationHarness<DataType
 };
 
 using IntegrationGpuMatmulFp32 = IntegrationGpuMatmul<float>;
-using IntegrationGpuMatmulFp16 = IntegrationGpuMatmul<half>;
-using IntegrationGpuMatmulBf16 = IntegrationGpuMatmul<hip_bfloat16>;
+using IntegrationGpuMatmulFp16 = IntegrationGpuMatmul<hipdnn_data_sdk::types::half>;
+using IntegrationGpuMatmulBf16 = IntegrationGpuMatmul<hipdnn_data_sdk::types::bfloat16>;
 
 } // namespace
 
@@ -85,12 +86,12 @@ TEST_P(IntegrationGpuMatmulFp32, Correctness)
 
 TEST_P(IntegrationGpuMatmulFp16, Correctness)
 {
-    runGraphTest(matmul::getTolerance<half>());
+    runGraphTest(matmul::getTolerance<hipdnn_data_sdk::types::half>());
 }
 
 TEST_P(IntegrationGpuMatmulBf16, Correctness)
 {
-    runGraphTest(matmul::getTolerance<hip_bfloat16>());
+    runGraphTest(matmul::getTolerance<hipdnn_data_sdk::types::bfloat16>());
 }
 
 INSTANTIATE_TEST_SUITE_P(IntegrationGpuMatmul,
 
@@ -66,7 +66,7 @@ class IntegrationGraphVerificationHarness : public ::testing::TestWithParam<Test
         }
     }
 
-    virtual void runGraphTest(DataType tolerance) = 0;
+    virtual void runGraphTest(float tolerance) = 0;
 
 protected:
     void verifyGraph(hipdnn_frontend::graph::Graph& graph, unsigned int seed)
 
@@ -58,7 +58,7 @@ class BatchnormBackward : public IntegrationGraphVerificationHarness<DataType, B
         }
     }
 
-    void runGraphTest(DataType tolerance, const TensorLayout& layout = TensorLayout::NCHW)
+    void runGraphTest(float tolerance, const TensorLayout& layout = TensorLayout::NCHW)
     {
         const BatchnormTestCase& testCase = this->GetParam();
 
@@ -134,53 +134,49 @@ class BatchnormBackward : public IntegrationGraphVerificationHarness<DataType, B
 
 using IntegrationGpuBatchnormBackwardNchwFp32 = BatchnormBackward<float, float>;
 
-using IntegrationGpuBatchnormBackwardNchwBfp16 = BatchnormBackward<hip_bfloat16, float>;
+using IntegrationGpuBatchnormBackwardNchwBfp16 = BatchnormBackward<bfloat16, float>;
 
 using IntegrationGpuBatchnormBackwardNchwFp16 = BatchnormBackward<half, float>;
 
 using IntegrationGpuBatchnormBackwardNhwcFp32 = BatchnormBackward<float, float>;
 
-using IntegrationGpuBatchnormBackwardNhwcBfp16 = BatchnormBackward<hip_bfloat16, float>;
+using IntegrationGpuBatchnormBackwardNhwcBfp16 = BatchnormBackward<bfloat16, float>;
 
 using IntegrationGpuBatchnormBackwardNhwcFp16 = BatchnormBackward<half, float>;
 
 using IntegrationGpuBatchnormBackwardNcdhwFp32 = BatchnormBackward<float, float>;
 
-using IntegrationGpuBatchnormBackwardNcdhwBfp16 = BatchnormBackward<hip_bfloat16, float>;
+using IntegrationGpuBatchnormBackwardNcdhwBfp16 = BatchnormBackward<bfloat16, float>;
 
 using IntegrationGpuBatchnormBackwardNcdhwFp16 = BatchnormBackward<half, float>;
 
 using IntegrationGpuBatchnormBackwardNdhwcFp32 = BatchnormBackward<float, float>;
 
-using IntegrationGpuBatchnormBackwardNdhwcBfp16 = BatchnormBackward<hip_bfloat16, float>;
+using IntegrationGpuBatchnormBackwardNdhwcBfp16 = BatchnormBackward<bfloat16, float>;
 
 using IntegrationGpuBatchnormBackwardNdhwcFp16 = BatchnormBackward<half, float>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNchwFp32 = BatchnormBackward<float, float, true>;
 
-using IntegrationGpuBatchnormBackwardCalcStatsNchwBfp16
-    = BatchnormBackward<hip_bfloat16, float, true>;
+using IntegrationGpuBatchnormBackwardCalcStatsNchwBfp16 = BatchnormBackward<bfloat16, float, true>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNchwFp16 = BatchnormBackward<half, float, true>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNhwcFp32 = BatchnormBackward<float, float, true>;
 
-using IntegrationGpuBatchnormBackwardCalcStatsNhwcBfp16
-    = BatchnormBackward<hip_bfloat16, float, true>;
+using IntegrationGpuBatchnormBackwardCalcStatsNhwcBfp16 = BatchnormBackward<bfloat16, float, true>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNhwcFp16 = BatchnormBackward<half, float, true>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNcdhwFp32 = BatchnormBackward<float, float, true>;
 
-using IntegrationGpuBatchnormBackwardCalcStatsNcdhwBfp16
-    = BatchnormBackward<hip_bfloat16, float, true>;
+using IntegrationGpuBatchnormBackwardCalcStatsNcdhwBfp16 = BatchnormBackward<bfloat16, float, true>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNcdhwFp16 = BatchnormBackward<half, float, true>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNdhwcFp32 = BatchnormBackward<float, float, true>;
 
-using IntegrationGpuBatchnormBackwardCalcStatsNdhwcBfp16
-    = BatchnormBackward<hip_bfloat16, float, true>;
+using IntegrationGpuBatchnormBackwardCalcStatsNdhwcBfp16 = BatchnormBackward<bfloat16, float, true>;
 
 using IntegrationGpuBatchnormBackwardCalcStatsNdhwcFp16 = BatchnormBackward<half, float, true>;
 
@@ -201,7 +197,7 @@ INSTANTIATE_TEST_SUITE_P(Full,
 
 TEST_P(IntegrationGpuBatchnormBackwardNchwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCHW);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -240,7 +236,7 @@ INSTANTIATE_TEST_SUITE_P(Full,
 
 TEST_P(IntegrationGpuBatchnormBackwardNhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NHWC);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -275,7 +271,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormBackwardNcdhwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCDHW);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCDHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -302,7 +298,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormBackwardNdhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NDHWC);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NDHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -329,7 +325,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNchwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCHW);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -356,7 +352,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NHWC);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -383,7 +379,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNcdhwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCDHW);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCDHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -410,7 +406,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNdhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NDHWC);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NDHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
 
@@ -60,7 +60,7 @@ class BatchnormBackwardActivation
             ->fillTensorWithRandomValues(1.9f, 2.0f, seed);
     }
 
-    void runGraphTest([[maybe_unused]] DataType tolerance, const TensorLayout& layout)
+    void runGraphTest([[maybe_unused]] float tolerance, const TensorLayout& layout)
     {
         namespace fe = hipdnn_frontend;
 
@@ -175,7 +175,7 @@ class BatchnormBackwardActivation
 
         auto intermediateTolerance = batchnorm::getToleranceBackward<float>();
 
-        this->registerValidator(dxOut, static_cast<float>(tolerance));
+        this->registerValidator(dxOut, tolerance);
         this->registerValidator(dscaleOut, intermediateTolerance);
         this->registerValidator(dbiasOut, intermediateTolerance);
 
@@ -185,29 +185,25 @@ class BatchnormBackwardActivation
 
 using IntegrationGpuBatchnormBackwardActivationNchwFp32 = BatchnormBackwardActivation<float>;
 
-using IntegrationGpuBatchnormBackwardActivationNchwBfp16
-    = BatchnormBackwardActivation<hip_bfloat16>;
+using IntegrationGpuBatchnormBackwardActivationNchwBfp16 = BatchnormBackwardActivation<bfloat16>;
 
 using IntegrationGpuBatchnormBackwardActivationNchwFp16 = BatchnormBackwardActivation<half>;
 
 using IntegrationGpuBatchnormBackwardActivationNhwcFp32 = BatchnormBackwardActivation<float>;
 
-using IntegrationGpuBatchnormBackwardActivationNhwcBfp16
-    = BatchnormBackwardActivation<hip_bfloat16>;
+using IntegrationGpuBatchnormBackwardActivationNhwcBfp16 = BatchnormBackwardActivation<bfloat16>;
 
 using IntegrationGpuBatchnormBackwardActivationNhwcFp16 = BatchnormBackwardActivation<half>;
 
 using IntegrationGpuBatchnormBackwardActivationNcdhwFp32 = BatchnormBackwardActivation<float>;
 
-using IntegrationGpuBatchnormBackwardActivationNcdhwBfp16
-    = BatchnormBackwardActivation<hip_bfloat16>;
+using IntegrationGpuBatchnormBackwardActivationNcdhwBfp16 = BatchnormBackwardActivation<bfloat16>;
 
 using IntegrationGpuBatchnormBackwardActivationNcdhwFp16 = BatchnormBackwardActivation<half>;
 
 using IntegrationGpuBatchnormBackwardActivationNdhwcFp32 = BatchnormBackwardActivation<float>;
 
-using IntegrationGpuBatchnormBackwardActivationNdhwcBfp16
-    = BatchnormBackwardActivation<hip_bfloat16>;
+using IntegrationGpuBatchnormBackwardActivationNdhwcBfp16 = BatchnormBackwardActivation<bfloat16>;
 
 using IntegrationGpuBatchnormBackwardActivationNdhwcFp16 = BatchnormBackwardActivation<half>;
 
@@ -234,7 +230,7 @@ INSTANTIATE_TEST_SUITE_P(
 
 TEST_P(IntegrationGpuBatchnormBackwardActivationNchwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCHW);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(
@@ -291,7 +287,7 @@ INSTANTIATE_TEST_SUITE_P(
 
 TEST_P(IntegrationGpuBatchnormBackwardActivationNhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NHWC);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(
@@ -341,7 +337,7 @@ INSTANTIATE_TEST_SUITE_P(
 
 TEST_P(IntegrationGpuBatchnormBackwardActivationNcdhwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCDHW);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCDHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(
@@ -377,7 +373,7 @@ INSTANTIATE_TEST_SUITE_P(
 
 TEST_P(IntegrationGpuBatchnormBackwardActivationNdhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NDHWC);
+    runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NDHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(
 
@@ -29,7 +29,7 @@ class BatchnormForwardInference
     : public IntegrationGraphVerificationHarness<DataType, BatchnormTestCase>
 {
 protected:
-    void runGraphTest(DataType tolerance, const TensorLayout& layout = TensorLayout::NCHW)
+    void runGraphTest(float tolerance, const TensorLayout& layout = TensorLayout::NCHW)
     {
         const BatchnormTestCase& testCase = this->GetParam();
 
@@ -86,29 +86,27 @@ class BatchnormForwardInference
 
 using IntegrationGpuBatchnormForwardInferenceNchwFp32 = BatchnormForwardInference<float, float>;
 
-using IntegrationGpuBatchnormForwardInferenceNchwBfp16
-    = BatchnormForwardInference<hip_bfloat16, float>;
+using IntegrationGpuBatchnormForwardInferenceNchwBfp16 = BatchnormForwardInference<bfloat16, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNchwFp16 = BatchnormForwardInference<half, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNhwcFp32 = BatchnormForwardInference<float, float>;
 
-using IntegrationGpuBatchnormForwardInferenceNhwcBfp16
-    = BatchnormForwardInference<hip_bfloat16, float>;
+using IntegrationGpuBatchnormForwardInferenceNhwcBfp16 = BatchnormForwardInference<bfloat16, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNhwcFp16 = BatchnormForwardInference<half, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNcdhwFp32 = BatchnormForwardInference<float, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNcdhwBfp16
-    = BatchnormForwardInference<hip_bfloat16, float>;
+    = BatchnormForwardInference<bfloat16, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNcdhwFp16 = BatchnormForwardInference<half, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNdhwcFp32 = BatchnormForwardInference<float, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNdhwcBfp16
-    = BatchnormForwardInference<hip_bfloat16, float>;
+    = BatchnormForwardInference<bfloat16, float>;
 
 using IntegrationGpuBatchnormForwardInferenceNdhwcFp16 = BatchnormForwardInference<half, float>;
 
@@ -129,7 +127,7 @@ INSTANTIATE_TEST_SUITE_P(Full,
 
 TEST_P(IntegrationGpuBatchnormForwardInferenceNchwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NCHW);
+    runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NCHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -168,7 +166,7 @@ INSTANTIATE_TEST_SUITE_P(Full,
 
 TEST_P(IntegrationGpuBatchnormForwardInferenceNhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NHWC);
+    runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -203,7 +201,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormForwardInferenceNcdhwBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NCDHW);
+    runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NCDHW);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
@@ -230,7 +228,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,
 
 TEST_P(IntegrationGpuBatchnormForwardInferenceNdhwcBfp16, Correctness)
 {
-    runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NDHWC);
+    runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NDHWC);
 }
 
 INSTANTIATE_TEST_SUITE_P(Smoke,
Original file line number	Diff line number	Diff line change
`@@ -5,6 +5,7 @@`
`5`	`5`	`#include <random>`
`6`	`6`
`7`	`7`	`#include <hip/hip_runtime.h>`
	`8`	`+#include <hipdnn_data_sdk/types.hpp>`
`8`	`9`	`#include <hipdnn_data_sdk/utilities/PlatformUtils.hpp>`
`9`	`10`	`#include <hipdnn_test_sdk/utilities/CpuFpReferenceValidation.hpp>`
`10`	`11`	`#include <hipdnn_test_sdk/utilities/TestTolerances.hpp>`
`@@ -26,7 +27,7 @@ template <typename DataType>`
`26`	`27`	`class IntegrationGpuMatmul : public IntegrationGraphVerificationHarness<DataType, MatmulTestCase>`
`27`	`28`	`{`
`28`	`29`	`protected:`
`29`		`- void runGraphTest(DataType tolerance) override`
	`30`	`+ void runGraphTest(float tolerance) override`
`30`	`31`	`{`
`31`	`32`	`const MatmulTestCase& testCase = this->GetParam();`
`32`	`33`
`@@ -73,8 +74,8 @@ class IntegrationGpuMatmul : public IntegrationGraphVerificationHarness<DataType`
`73`	`74`	`};`
`74`	`75`
`75`	`76`	`using IntegrationGpuMatmulFp32 = IntegrationGpuMatmul<float>;`
`76`		`-using IntegrationGpuMatmulFp16 = IntegrationGpuMatmul<half>;`
`77`		`-using IntegrationGpuMatmulBf16 = IntegrationGpuMatmul<hip_bfloat16>;`
	`77`	`+using IntegrationGpuMatmulFp16 = IntegrationGpuMatmul<hipdnn_data_sdk::types::half>;`
	`78`	`+using IntegrationGpuMatmulBf16 = IntegrationGpuMatmul<hipdnn_data_sdk::types::bfloat16>;`
`78`	`79`
`79`	`80`	`} // namespace`
`80`	`81`
`@@ -85,12 +86,12 @@ TEST_P(IntegrationGpuMatmulFp32, Correctness)`
`85`	`86`
`86`	`87`	`TEST_P(IntegrationGpuMatmulFp16, Correctness)`
`87`	`88`	`{`
`88`		`- runGraphTest(matmul::getTolerance<half>());`
	`89`	`+ runGraphTest(matmul::getTolerance<hipdnn_data_sdk::types::half>());`
`89`	`90`	`}`
`90`	`91`
`91`	`92`	`TEST_P(IntegrationGpuMatmulBf16, Correctness)`
`92`	`93`	`{`
`93`		`- runGraphTest(matmul::getTolerance<hip_bfloat16>());`
	`94`	`+ runGraphTest(matmul::getTolerance<hipdnn_data_sdk::types::bfloat16>());`
`94`	`95`	`}`
`95`	`96`
`96`	`97`	`INSTANTIATE_TEST_SUITE_P(IntegrationGpuMatmul,`
Original file line number	Diff line number	Diff line change
`@@ -66,7 +66,7 @@ class IntegrationGraphVerificationHarness : public ::testing::TestWithParam<Test`
`66`	`66`	`}`
`67`	`67`	`}`
`68`	`68`
`69`		`- virtual void runGraphTest(DataType tolerance) = 0;`
	`69`	`+ virtual void runGraphTest(float tolerance) = 0;`
`70`	`70`
`71`	`71`	`protected:`
`72`	`72`	`void verifyGraph(hipdnn_frontend::graph::Graph& graph, unsigned int seed)`
Original file line number	Diff line number	Diff line change
`@@ -58,7 +58,7 @@ class BatchnormBackward : public IntegrationGraphVerificationHarness<DataType, B`
`58`	`58`	`}`
`59`	`59`	`}`
`60`	`60`
`61`		`- void runGraphTest(DataType tolerance, const TensorLayout& layout = TensorLayout::NCHW)`
	`61`	`+ void runGraphTest(float tolerance, const TensorLayout& layout = TensorLayout::NCHW)`
`62`	`62`	`{`
`63`	`63`	`const BatchnormTestCase& testCase = this->GetParam();`
`64`	`64`
`@@ -134,53 +134,49 @@ class BatchnormBackward : public IntegrationGraphVerificationHarness<DataType, B`
`134`	`134`
`135`	`135`	`using IntegrationGpuBatchnormBackwardNchwFp32 = BatchnormBackward<float, float>;`
`136`	`136`
`137`		`-using IntegrationGpuBatchnormBackwardNchwBfp16 = BatchnormBackward<hip_bfloat16, float>;`
	`137`	`+using IntegrationGpuBatchnormBackwardNchwBfp16 = BatchnormBackward<bfloat16, float>;`
`138`	`138`
`139`	`139`	`using IntegrationGpuBatchnormBackwardNchwFp16 = BatchnormBackward<half, float>;`
`140`	`140`
`141`	`141`	`using IntegrationGpuBatchnormBackwardNhwcFp32 = BatchnormBackward<float, float>;`
`142`	`142`
`143`		`-using IntegrationGpuBatchnormBackwardNhwcBfp16 = BatchnormBackward<hip_bfloat16, float>;`
	`143`	`+using IntegrationGpuBatchnormBackwardNhwcBfp16 = BatchnormBackward<bfloat16, float>;`
`144`	`144`
`145`	`145`	`using IntegrationGpuBatchnormBackwardNhwcFp16 = BatchnormBackward<half, float>;`
`146`	`146`
`147`	`147`	`using IntegrationGpuBatchnormBackwardNcdhwFp32 = BatchnormBackward<float, float>;`
`148`	`148`
`149`		`-using IntegrationGpuBatchnormBackwardNcdhwBfp16 = BatchnormBackward<hip_bfloat16, float>;`
	`149`	`+using IntegrationGpuBatchnormBackwardNcdhwBfp16 = BatchnormBackward<bfloat16, float>;`
`150`	`150`
`151`	`151`	`using IntegrationGpuBatchnormBackwardNcdhwFp16 = BatchnormBackward<half, float>;`
`152`	`152`
`153`	`153`	`using IntegrationGpuBatchnormBackwardNdhwcFp32 = BatchnormBackward<float, float>;`
`154`	`154`
`155`		`-using IntegrationGpuBatchnormBackwardNdhwcBfp16 = BatchnormBackward<hip_bfloat16, float>;`
	`155`	`+using IntegrationGpuBatchnormBackwardNdhwcBfp16 = BatchnormBackward<bfloat16, float>;`
`156`	`156`
`157`	`157`	`using IntegrationGpuBatchnormBackwardNdhwcFp16 = BatchnormBackward<half, float>;`
`158`	`158`
`159`	`159`	`using IntegrationGpuBatchnormBackwardCalcStatsNchwFp32 = BatchnormBackward<float, float, true>;`
`160`	`160`
`161`		`-using IntegrationGpuBatchnormBackwardCalcStatsNchwBfp16`
`162`		`- = BatchnormBackward<hip_bfloat16, float, true>;`
	`161`	`+using IntegrationGpuBatchnormBackwardCalcStatsNchwBfp16 = BatchnormBackward<bfloat16, float, true>;`
`163`	`162`
`164`	`163`	`using IntegrationGpuBatchnormBackwardCalcStatsNchwFp16 = BatchnormBackward<half, float, true>;`
`165`	`164`
`166`	`165`	`using IntegrationGpuBatchnormBackwardCalcStatsNhwcFp32 = BatchnormBackward<float, float, true>;`
`167`	`166`
`168`		`-using IntegrationGpuBatchnormBackwardCalcStatsNhwcBfp16`
`169`		`- = BatchnormBackward<hip_bfloat16, float, true>;`
	`167`	`+using IntegrationGpuBatchnormBackwardCalcStatsNhwcBfp16 = BatchnormBackward<bfloat16, float, true>;`
`170`	`168`
`171`	`169`	`using IntegrationGpuBatchnormBackwardCalcStatsNhwcFp16 = BatchnormBackward<half, float, true>;`
`172`	`170`
`173`	`171`	`using IntegrationGpuBatchnormBackwardCalcStatsNcdhwFp32 = BatchnormBackward<float, float, true>;`
`174`	`172`
`175`		`-using IntegrationGpuBatchnormBackwardCalcStatsNcdhwBfp16`
`176`		`- = BatchnormBackward<hip_bfloat16, float, true>;`
	`173`	`+using IntegrationGpuBatchnormBackwardCalcStatsNcdhwBfp16 = BatchnormBackward<bfloat16, float, true>;`
`177`	`174`
`178`	`175`	`using IntegrationGpuBatchnormBackwardCalcStatsNcdhwFp16 = BatchnormBackward<half, float, true>;`
`179`	`176`
`180`	`177`	`using IntegrationGpuBatchnormBackwardCalcStatsNdhwcFp32 = BatchnormBackward<float, float, true>;`
`181`	`178`
`182`		`-using IntegrationGpuBatchnormBackwardCalcStatsNdhwcBfp16`
`183`		`- = BatchnormBackward<hip_bfloat16, float, true>;`
	`179`	`+using IntegrationGpuBatchnormBackwardCalcStatsNdhwcBfp16 = BatchnormBackward<bfloat16, float, true>;`
`184`	`180`
`185`	`181`	`using IntegrationGpuBatchnormBackwardCalcStatsNdhwcFp16 = BatchnormBackward<half, float, true>;`
`186`	`182`
`@@ -201,7 +197,7 @@ INSTANTIATE_TEST_SUITE_P(Full,`
`201`	`197`
`202`	`198`	`TEST_P(IntegrationGpuBatchnormBackwardNchwBfp16, Correctness)`
`203`	`199`	`{`
`204`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCHW);`
	`200`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCHW);`
`205`	`201`	`}`
`206`	`202`
`207`	`203`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -240,7 +236,7 @@ INSTANTIATE_TEST_SUITE_P(Full,`
`240`	`236`
`241`	`237`	`TEST_P(IntegrationGpuBatchnormBackwardNhwcBfp16, Correctness)`
`242`	`238`	`{`
`243`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NHWC);`
	`239`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NHWC);`
`244`	`240`	`}`
`245`	`241`
`246`	`242`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -275,7 +271,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`275`	`271`
`276`	`272`	`TEST_P(IntegrationGpuBatchnormBackwardNcdhwBfp16, Correctness)`
`277`	`273`	`{`
`278`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCDHW);`
	`274`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCDHW);`
`279`	`275`	`}`
`280`	`276`
`281`	`277`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -302,7 +298,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`302`	`298`
`303`	`299`	`TEST_P(IntegrationGpuBatchnormBackwardNdhwcBfp16, Correctness)`
`304`	`300`	`{`
`305`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NDHWC);`
	`301`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NDHWC);`
`306`	`302`	`}`
`307`	`303`
`308`	`304`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -329,7 +325,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`329`	`325`
`330`	`326`	`TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNchwBfp16, Correctness)`
`331`	`327`	`{`
`332`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCHW);`
	`328`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCHW);`
`333`	`329`	`}`
`334`	`330`
`335`	`331`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -356,7 +352,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`356`	`352`
`357`	`353`	`TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNhwcBfp16, Correctness)`
`358`	`354`	`{`
`359`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NHWC);`
	`355`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NHWC);`
`360`	`356`	`}`
`361`	`357`
`362`	`358`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -383,7 +379,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`383`	`379`
`384`	`380`	`TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNcdhwBfp16, Correctness)`
`385`	`381`	`{`
`386`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NCDHW);`
	`382`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NCDHW);`
`387`	`383`	`}`
`388`	`384`
`389`	`385`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -410,7 +406,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`410`	`406`
`411`	`407`	`TEST_P(IntegrationGpuBatchnormBackwardCalcStatsNdhwcBfp16, Correctness)`
`412`	`408`	`{`
`413`		`- runGraphTest(batchnorm::getToleranceBackward<hip_bfloat16>(), TensorLayout::NDHWC);`
	`409`	`+ runGraphTest(batchnorm::getToleranceBackward<bfloat16>(), TensorLayout::NDHWC);`
`414`	`410`	`}`
`415`	`411`
`416`	`412`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
Original file line number	Diff line number	Diff line change
`@@ -29,7 +29,7 @@ class BatchnormForwardInference`
`29`	`29`	`: public IntegrationGraphVerificationHarness<DataType, BatchnormTestCase>`
`30`	`30`	`{`
`31`	`31`	`protected:`
`32`		`- void runGraphTest(DataType tolerance, const TensorLayout& layout = TensorLayout::NCHW)`
	`32`	`+ void runGraphTest(float tolerance, const TensorLayout& layout = TensorLayout::NCHW)`
`33`	`33`	`{`
`34`	`34`	`const BatchnormTestCase& testCase = this->GetParam();`
`35`	`35`
`@@ -86,29 +86,27 @@ class BatchnormForwardInference`
`86`	`86`
`87`	`87`	`using IntegrationGpuBatchnormForwardInferenceNchwFp32 = BatchnormForwardInference<float, float>;`
`88`	`88`
`89`		`-using IntegrationGpuBatchnormForwardInferenceNchwBfp16`
`90`		`- = BatchnormForwardInference<hip_bfloat16, float>;`
	`89`	`+using IntegrationGpuBatchnormForwardInferenceNchwBfp16 = BatchnormForwardInference<bfloat16, float>;`
`91`	`90`
`92`	`91`	`using IntegrationGpuBatchnormForwardInferenceNchwFp16 = BatchnormForwardInference<half, float>;`
`93`	`92`
`94`	`93`	`using IntegrationGpuBatchnormForwardInferenceNhwcFp32 = BatchnormForwardInference<float, float>;`
`95`	`94`
`96`		`-using IntegrationGpuBatchnormForwardInferenceNhwcBfp16`
`97`		`- = BatchnormForwardInference<hip_bfloat16, float>;`
	`95`	`+using IntegrationGpuBatchnormForwardInferenceNhwcBfp16 = BatchnormForwardInference<bfloat16, float>;`
`98`	`96`
`99`	`97`	`using IntegrationGpuBatchnormForwardInferenceNhwcFp16 = BatchnormForwardInference<half, float>;`
`100`	`98`
`101`	`99`	`using IntegrationGpuBatchnormForwardInferenceNcdhwFp32 = BatchnormForwardInference<float, float>;`
`102`	`100`
`103`	`101`	`using IntegrationGpuBatchnormForwardInferenceNcdhwBfp16`
`104`		`- = BatchnormForwardInference<hip_bfloat16, float>;`
	`102`	`+ = BatchnormForwardInference<bfloat16, float>;`
`105`	`103`
`106`	`104`	`using IntegrationGpuBatchnormForwardInferenceNcdhwFp16 = BatchnormForwardInference<half, float>;`
`107`	`105`
`108`	`106`	`using IntegrationGpuBatchnormForwardInferenceNdhwcFp32 = BatchnormForwardInference<float, float>;`
`109`	`107`
`110`	`108`	`using IntegrationGpuBatchnormForwardInferenceNdhwcBfp16`
`111`		`- = BatchnormForwardInference<hip_bfloat16, float>;`
	`109`	`+ = BatchnormForwardInference<bfloat16, float>;`
`112`	`110`
`113`	`111`	`using IntegrationGpuBatchnormForwardInferenceNdhwcFp16 = BatchnormForwardInference<half, float>;`
`114`	`112`
`@@ -129,7 +127,7 @@ INSTANTIATE_TEST_SUITE_P(Full,`
`129`	`127`
`130`	`128`	`TEST_P(IntegrationGpuBatchnormForwardInferenceNchwBfp16, Correctness)`
`131`	`129`	`{`
`132`		`- runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NCHW);`
	`130`	`+ runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NCHW);`
`133`	`131`	`}`
`134`	`132`
`135`	`133`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -168,7 +166,7 @@ INSTANTIATE_TEST_SUITE_P(Full,`
`168`	`166`
`169`	`167`	`TEST_P(IntegrationGpuBatchnormForwardInferenceNhwcBfp16, Correctness)`
`170`	`168`	`{`
`171`		`- runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NHWC);`
	`169`	`+ runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NHWC);`
`172`	`170`	`}`
`173`	`171`
`174`	`172`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -203,7 +201,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`203`	`201`
`204`	`202`	`TEST_P(IntegrationGpuBatchnormForwardInferenceNcdhwBfp16, Correctness)`
`205`	`203`	`{`
`206`		`- runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NCDHW);`
	`204`	`+ runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NCDHW);`
`207`	`205`	`}`
`208`	`206`
`209`	`207`	`INSTANTIATE_TEST_SUITE_P(Smoke,`
`@@ -230,7 +228,7 @@ INSTANTIATE_TEST_SUITE_P(Smoke,`
`230`	`228`
`231`	`229`	`TEST_P(IntegrationGpuBatchnormForwardInferenceNdhwcBfp16, Correctness)`
`232`	`230`	`{`
`233`		`- runGraphTest(batchnorm::getToleranceInference<hip_bfloat16>(), TensorLayout::NDHWC);`
	`231`	`+ runGraphTest(batchnorm::getToleranceInference<bfloat16>(), TensorLayout::NDHWC);`
`234`	`232`	`}`
`235`	`233`
`236`	`234`	`INSTANTIATE_TEST_SUITE_P(Smoke,`