foss-for-synopsys-dwc-arc-processors
diff --git a/‎include/api/mli_krn_avepool_spec_api.h‎
Lines changed: 2 additions & 0 deletions b/‎include/api/mli_krn_avepool_spec_api.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎include/api/mli_krn_conv2d_spec_api.h‎
Lines changed: 257 additions & 0 deletions b/‎include/api/mli_krn_conv2d_spec_api.h‎
Lines changed: 257 additions & 0 deletions
@@ -23,6 +23,7 @@ extern "C" {
 //===================================================================
 // AvePooling specialization kernels implementation
 //===================================================================
+char * mli_debug_krn_avepool_chw_fx16(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 
 mli_status mli_krn_avepool_chw_fx16_k2x2_str1_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_k4x4_str1_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
@@ -55,6 +56,7 @@ mli_status mli_krn_avepool_chw_fx16_knx1_nopad(const mli_tensor * in, const mli_
 mli_status mli_krn_avepool_chw_fx16_k2x1_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_k3x1_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_generic(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
+char * mli_debug_krn_avepool_chw_fx8(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 
 mli_status mli_krn_avepool_chw_fx8_k2x2_str1_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx8_k4x4_str1_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 
@@ -23,6 +23,12 @@ extern "C" {
 //===================================================================
 // Convolution 2d specialization kernels implementation
 //===================================================================
+char * mli_debug_krn_conv2d_chw_fx16(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
 
 mli_status mli_krn_conv2d_chw_fx16_k1x1_str1_nopad(
         const mli_tensor * in, 
@@ -276,6 +282,12 @@ mli_status mli_krn_conv2d_chw_fx16_generic(
         const mli_conv2d_cfg * cfg, 
         mli_tensor * out);
 
+char * mli_debug_krn_conv2d_chw_fx8(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
 
 mli_status mli_krn_conv2d_chw_fx8_k1x1_str1_nopad(
         const mli_tensor * in, 
@@ -515,6 +527,251 @@ mli_status mli_krn_conv2d_chw_fx8_generic(
         const mli_conv2d_cfg * cfg, 
         mli_tensor * out);
 
+char * mli_debug_krn_conv2d_chw_fx8w16d(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_str1_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_ch1_str1_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_ch3_str1_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_ch4_str1_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k2x2_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k2x2_ch1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k3x3_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k3x3_ch1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k4x4_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k4x4_ch1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k5x5_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k5x5_ch1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k6x6_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k6x6_ch1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k7x7_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k7x7_ch1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x2_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x3_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k2x1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k3x1_str1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1xn_str1(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_knx1_str1(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_ch1_str1(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_str1(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_ch1_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_ch3_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_ch4_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k1x1_ch8_nopad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k2x2_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k2x2_ch1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k3x3_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_k3x3_ch1_krnpad(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
+mli_status mli_krn_conv2d_chw_fx8w16d_generic(
+        const mli_tensor * in, 
+        const mli_tensor * weights, 
+        const mli_tensor * bias, 
+        const mli_conv2d_cfg * cfg, 
+        mli_tensor * out);
+
 
 #ifdef __cplusplus
 }