add specialization for avepool k2x2

JaccovG · JaccovG · commit 0e3c5dc308cf · 2019-06-26T17:07:05.000+02:00
diff --git a/include/api/mli_krn_avepool_spec_api.h b/include/api/mli_krn_avepool_spec_api.h
@@ -38,6 +38,7 @@ mli_status mli_krn_avepool_chw_fx16_k3x3_nopad(const mli_tensor * in, const mli_
 mli_status mli_krn_avepool_chw_fx16_k5x5_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_k7x7_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_k9x9_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
+mli_status mli_krn_avepool_chw_fx16_k2x2_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_k4x4_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_k6x6_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx16_k8x8_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
@@ -69,6 +70,7 @@ mli_status mli_krn_avepool_chw_fx8_k3x3_nopad(const mli_tensor * in, const mli_p
 mli_status mli_krn_avepool_chw_fx8_k5x5_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx8_k7x7_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx8_k9x9_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
+mli_status mli_krn_avepool_chw_fx8_k2x2_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx8_k4x4_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx8_k6x6_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
 mli_status mli_krn_avepool_chw_fx8_k8x8_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out);
diff --git a/lib/gen/mli_krn_avepool_gen.py b/lib/gen/mli_krn_avepool_gen.py
@@ -78,7 +78,7 @@
 
 corefunc = "avepool_chw_nopad_k4_Nx2_N_even"
 stride = 0
-kernel_range = range(4, 9, 2)
+kernel_range = range(2, 9, 2)
 ch = 0
 f_list.extend([Func(fbase, k, k, ch, stride, stride, corefunc, "nopad") for k in kernel_range])
 
diff --git a/lib/src/kernels/pooling/mli_krn_avepool_chw_fx16.cc b/lib/src/kernels/pooling/mli_krn_avepool_chw_fx16.cc
@@ -1107,6 +1107,83 @@ mli_status mli_krn_avepool_chw_fx16_k9x9_nopad(const mli_tensor * in, const mli_
     return MLI_STATUS_OK;
 }
 
+mli_status mli_krn_avepool_chw_fx16_k2x2_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out) {
+    mli_status ret = MLI_CHECK_STATUS(mli_chk_avepool_chw_fx16(in, cfg, out), __func__);
+    if (ret != MLI_STATUS_OK)
+        return ret;
+
+    // Extract general avepool parameters
+    int stride_width = cfg->stride_width;
+    int stride_height = cfg->stride_height;
+    int padding_top = cfg->padding_top;
+    int padding_bot = cfg->padding_bottom;
+    int padding_left = cfg->padding_left;
+    int padding_right = cfg->padding_right;
+    int channels_num = in->shape[FMAP_C_DIM_CHW];
+    int kernel_height = cfg->kernel_height;
+    int kernel_width = cfg->kernel_width;
+    // assign hard coded values for this variation to some variables
+#if 0
+    MLI_CHECK_AND_FIX(stride_width, 0);
+#endif
+#if 0
+    MLI_CHECK_AND_FIX(stride_height, 0);
+#endif
+#if 1
+    MLI_CHECK_AND_FIX(padding_top, 0);
+    MLI_CHECK_AND_FIX(padding_bot, 0);
+    MLI_CHECK_AND_FIX(padding_left, 0);
+    MLI_CHECK_AND_FIX(padding_right, 0);
+#endif
+#if 2
+    MLI_CHECK_AND_FIX(kernel_width, 2);
+#endif
+#if 2
+    MLI_CHECK_AND_FIX(kernel_height, 2);
+#endif
+#if 0
+    MLI_CHECK_AND_FIX(channels_num, 0);
+#endif
+
+    // Data pointers
+    MLI_PTR(int16_t) in_ftrs = (MLI_PTR(int16_t ))in->data;
+    MLI_OUT_PTR(int16_t) out_ftrs = (MLI_OUT_PTR(int16_t ))out->data;
+
+    // Define Data dimensions
+    const int in_height = in->shape[FMAP_H_DIM_CHW];
+    const int in_width = in->shape[FMAP_W_DIM_CHW];
+
+    const int out_width = CEIL_DIV(in_width + padding_left + padding_right - kernel_width + 1, stride_width);
+    const int out_height = CEIL_DIV(in_height + padding_top + padding_bot - kernel_height + 1, stride_height);
+
+    const int row_beg = 0;
+    const int row_end = out_height;
+    const int clmn_beg = 0;
+    const int clmn_end = out_width;
+
+    mli_prv_fx_init_dsp_ctrl();
+
+    avepool_chw_nopad_k4_Nx2_N_even(
+        row_beg, row_end,
+        clmn_beg, clmn_end,
+        in_ftrs, out_ftrs,
+        channels_num, in_width, in_height,
+        out_width, out_height,
+        kernel_height, kernel_width,
+        stride_height, stride_width,
+        padding_top, padding_left, padding_right, padding_bot);
+
+    // fill output tensor parameters
+    out->el_type = in->el_type;
+    out->rank = in->rank;
+    out->shape[FMAP_C_DIM_CHW] = channels_num;
+    out->shape[FMAP_H_DIM_CHW] = out_height;
+    out->shape[FMAP_W_DIM_CHW] = out_width;
+    out->el_params.fx.frac_bits = in->el_params.fx.frac_bits;
+
+    return MLI_STATUS_OK;
+}
+
 mli_status mli_krn_avepool_chw_fx16_k4x4_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out) {
     mli_status ret = MLI_CHECK_STATUS(mli_chk_avepool_chw_fx16(in, cfg, out), __func__);
     if (ret != MLI_STATUS_OK)
@@ -2390,6 +2467,8 @@ mli_status mli_krn_avepool_chw_fx16(const mli_tensor * in, const mli_pool_cfg *
         return mli_krn_avepool_chw_fx16_k3x1_nopad(in, cfg, out);
     } else if ((kernel_w == 3) && (kernel_h == 1) && (padding_top <= 0) && (padding_bot <= 0) && (padding_left <= 1) && (padding_right <= 1)) {
         return mli_krn_avepool_chw_fx16_k3x1_krnpad(in, cfg, out);
+    } else if ((kernel_w == 2) && (kernel_h == 2) && (padding_top == 0) && (padding_bot == 0) && (padding_left == 0) && (padding_right == 0)) {
+        return mli_krn_avepool_chw_fx16_k2x2_nopad(in, cfg, out);
     } else if ((kernel_w == 2) && (kernel_h == 2) && (padding_top <= 0) && (padding_bot <= 1) && (padding_left <= 0) && (padding_right <= 1)) {
         return mli_krn_avepool_chw_fx16_k2x2_krnpad(in, cfg, out);
     } else if ((kernel_w == 2) && (kernel_h == 1) && (padding_top == 0) && (padding_bot == 0) && (padding_left == 0) && (padding_right == 0)) {
diff --git a/lib/src/kernels/pooling/mli_krn_avepool_chw_fx8.cc b/lib/src/kernels/pooling/mli_krn_avepool_chw_fx8.cc
@@ -1107,6 +1107,83 @@ mli_status mli_krn_avepool_chw_fx8_k9x9_nopad(const mli_tensor * in, const mli_p
     return MLI_STATUS_OK;
 }
 
+mli_status mli_krn_avepool_chw_fx8_k2x2_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out) {
+    mli_status ret = MLI_CHECK_STATUS(mli_chk_avepool_chw_fx8(in, cfg, out), __func__);
+    if (ret != MLI_STATUS_OK)
+        return ret;
+
+    // Extract general avepool parameters
+    int stride_width = cfg->stride_width;
+    int stride_height = cfg->stride_height;
+    int padding_top = cfg->padding_top;
+    int padding_bot = cfg->padding_bottom;
+    int padding_left = cfg->padding_left;
+    int padding_right = cfg->padding_right;
+    int channels_num = in->shape[FMAP_C_DIM_CHW];
+    int kernel_height = cfg->kernel_height;
+    int kernel_width = cfg->kernel_width;
+    // assign hard coded values for this variation to some variables
+#if 0
+    MLI_CHECK_AND_FIX(stride_width, 0);
+#endif
+#if 0
+    MLI_CHECK_AND_FIX(stride_height, 0);
+#endif
+#if 1
+    MLI_CHECK_AND_FIX(padding_top, 0);
+    MLI_CHECK_AND_FIX(padding_bot, 0);
+    MLI_CHECK_AND_FIX(padding_left, 0);
+    MLI_CHECK_AND_FIX(padding_right, 0);
+#endif
+#if 2
+    MLI_CHECK_AND_FIX(kernel_width, 2);
+#endif
+#if 2
+    MLI_CHECK_AND_FIX(kernel_height, 2);
+#endif
+#if 0
+    MLI_CHECK_AND_FIX(channels_num, 0);
+#endif
+
+    // Data pointers
+    MLI_PTR(int8_t) in_ftrs = (MLI_PTR(int8_t ))in->data;
+    MLI_OUT_PTR(int8_t) out_ftrs = (MLI_OUT_PTR(int8_t ))out->data;
+
+    // Define Data dimensions
+    const int in_height = in->shape[FMAP_H_DIM_CHW];
+    const int in_width = in->shape[FMAP_W_DIM_CHW];
+
+    const int out_width = CEIL_DIV(in_width + padding_left + padding_right - kernel_width + 1, stride_width);
+    const int out_height = CEIL_DIV(in_height + padding_top + padding_bot - kernel_height + 1, stride_height);
+
+    const int row_beg = 0;
+    const int row_end = out_height;
+    const int clmn_beg = 0;
+    const int clmn_end = out_width;
+
+    mli_prv_fx_init_dsp_ctrl();
+
+    avepool_chw_nopad_k4_Nx2_N_even(
+        row_beg, row_end,
+        clmn_beg, clmn_end,
+        in_ftrs, out_ftrs,
+        channels_num, in_width, in_height,
+        out_width, out_height,
+        kernel_height, kernel_width,
+        stride_height, stride_width,
+        padding_top, padding_left, padding_right, padding_bot);
+
+    // fill output tensor parameters
+    out->el_type = in->el_type;
+    out->rank = in->rank;
+    out->shape[FMAP_C_DIM_CHW] = channels_num;
+    out->shape[FMAP_H_DIM_CHW] = out_height;
+    out->shape[FMAP_W_DIM_CHW] = out_width;
+    out->el_params.fx.frac_bits = in->el_params.fx.frac_bits;
+
+    return MLI_STATUS_OK;
+}
+
 mli_status mli_krn_avepool_chw_fx8_k4x4_nopad(const mli_tensor * in, const mli_pool_cfg * cfg, mli_tensor * out) {
     mli_status ret = MLI_CHECK_STATUS(mli_chk_avepool_chw_fx8(in, cfg, out), __func__);
     if (ret != MLI_STATUS_OK)
@@ -2390,6 +2467,8 @@ mli_status mli_krn_avepool_chw_fx8(const mli_tensor * in, const mli_pool_cfg * c
         return mli_krn_avepool_chw_fx8_k3x1_nopad(in, cfg, out);
     } else if ((kernel_w == 3) && (kernel_h == 1) && (padding_top <= 0) && (padding_bot <= 0) && (padding_left <= 1) && (padding_right <= 1)) {
         return mli_krn_avepool_chw_fx8_k3x1_krnpad(in, cfg, out);
+    } else if ((kernel_w == 2) && (kernel_h == 2) && (padding_top == 0) && (padding_bot == 0) && (padding_left == 0) && (padding_right == 0)) {
+        return mli_krn_avepool_chw_fx8_k2x2_nopad(in, cfg, out);
     } else if ((kernel_w == 2) && (kernel_h == 2) && (padding_top <= 0) && (padding_bot <= 1) && (padding_left <= 0) && (padding_right <= 1)) {
         return mli_krn_avepool_chw_fx8_k2x2_krnpad(in, cfg, out);
     } else if ((kernel_w == 2) && (kernel_h == 1) && (padding_top == 0) && (padding_bot == 0) && (padding_left == 0) && (padding_right == 0)) {