transposed conv cs interface update

yaroslav · JaccovG · commit 6008b958c1b2 · 2022-10-19T11:54:30.000Z
diff --git a/include/api/mli_ref_compiler_api.hpp b/include/api/mli_ref_compiler_api.hpp
@@ -341,7 +341,7 @@ class TransposeConv2D_CS : public lib_mli::TransposeConv2D_CS {
 public:
     /**
      * @brief Constructor of the TransposeConv2D_CS object
-     *
+     * @deprecated
      */
     TransposeConv2D_CS(const lib_mli::PlatformDescription pd,
                        const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank> &input,
@@ -371,16 +371,34 @@ class TransposeConv2D_CS : public lib_mli::TransposeConv2D_CS {
                        const TensorIterator<NoBuffer, kTransposeConvWRank,  kTransposeConvIterRank> &weights,
                        const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvIterRank> &weights_zp,
                        const TransposeConv2DConfig &cfg,
-                       const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank> &output) { NOT_IMPLEMENTED_METHOD; };
+                       const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank> &output);
 
+    /**
+     * @deprecated
+     */
     mli_status EncodeWeights(Tensor<Buffer, kTransposeConvWRank> &weights, Buffer &encoded_weights,
                              compression_mode_t mode = compression_mode_t::Uncompressed) override;
 
+    mli_status EncodeWeightsAndZeroPts(TensorIterator<Buffer, kTransposeConvWRank, kTransposeConvIterRank>& weights,
+                                       TensorIterator<Buffer, kTransposeConvZPRank, kTransposeConvIterRank>& weights_zp,
+                                       Buffer& encoded_weights) override;
+
+    unsigned GetEncodedWeightsSize() const override;
+
+    /**
+     * @deprecated
+     */
     mli_status EncodeInpZeroPts(Tensor<Buffer, kTransposeConvZPRank> &inpzeropts,
                                 Buffer &encoded_inpzeropts) override;
 
+    mli_status EncodeInpZeroPts(TensorIterator<Buffer, kTransposeConvZPRank, kTransposeConvZPIterRank>& input_zp,
+                                Buffer& encoded_input_zp) override;
+
     unsigned GetEncodedInpZeroPtsSize() const override;
 
+    /**
+     * @deprecated
+     */
     mli_status EncodeWtsZeroPts(Tensor<Buffer, kTransposeConvZPRank> &wtszeropts,
                                 Buffer &encoded_wtszeropts) override;
 
@@ -408,6 +426,8 @@ class TransposeConv2D_CS : public lib_mli::TransposeConv2D_CS {
     OffsetBuffer m_inpzp_buffer;
     OffsetBuffer m_wtszp_buffer;
 
+    uint32_t m_weights_buffer_size;
+
     // The axis to represent the quantization granularity (optional for FX type)
     int m_inp_quant_axis;
     int m_wts_quant_axis;
diff --git a/include/mli_compiler_api.hpp b/include/mli_compiler_api.hpp
@@ -1347,6 +1347,7 @@ class TransposeConv2D_CS : public CompilerGenericInterface {
      * specific kernel implementation. This transformation may include
      * compression. The content of the encode_weights buffer is opaque for the
      * user.
+     * @deprecated
      *
      * @param weights [I] tensor with the weights
      * @param buffer_t [I] buffer pointer where the encode function can write
@@ -1373,22 +1374,20 @@ class TransposeConv2D_CS : public CompilerGenericInterface {
      */
     virtual mli_status EncodeWeightsAndZeroPts(TensorIterator<Buffer, kTransposeConvWRank,  kTransposeConvIterRank> &weights,
                                                TensorIterator<Buffer, kTransposeConvZPRank, kTransposeConvIterRank> &weights_zp,
-                                               Buffer &encoded_weights)
-                                               { NOT_IMPLEMENTED_METHOD;
-                                                 return MLI_STATUS_OK; };
-    // /**
-    //  * @brief Method to query the size of the encoded weights buffer
-    //  *
-    //  * This function returns the size of the full weights buffer that
-    //  * is needed by the EncodeWeights method.
-    //  *
-    //  * @return Size of encoded weights buffer in bytes
-    //  */
-    // virtual unsigned GetEncodedWeightsSize() const = 0;
+                                               Buffer &encoded_weights) = 0;
+     /**
+      * @brief Method to query the size of the encoded weights buffer
+      *
+      * This function returns the size of the full weights buffer that
+      * is needed by the EncodeWeights method.
+      *
+      * @return Size of encoded weights buffer in bytes
+      */
+     virtual unsigned GetEncodedWeightsSize() const = 0;
 
     /**
      * @brief Method to encode input zero-points (padding values)
-     *
+     * @deprecated
      * This method will read the input zero-points buffer in a platform
      * independent layout and translate it into a buffer that can be easily read
      * by the platform specific kernel implementation. The content of the
@@ -1412,9 +1411,7 @@ class TransposeConv2D_CS : public CompilerGenericInterface {
      * 
      */
     virtual mli_status EncodeInpZeroPts(TensorIterator<Buffer, kTransposeConvZPRank, kTransposeConvZPIterRank> &input_zp,
-                                        Buffer& encoded_input_zp)
-                                        { NOT_IMPLEMENTED_METHOD;
-                                          return MLI_STATUS_OK; };
+                                        Buffer& encoded_input_zp) = 0;
 
     /**
      * @brief Method to query the size of the encoded input zero-points buffer
diff --git a/include/mli_kernels_factory.hpp b/include/mli_kernels_factory.hpp
@@ -1275,7 +1275,7 @@ class KernelsFactory {
     /**
      * @brief Transpose Convolution 2D kernel Compiler Support interface factory
      * method
-     *
+     * @deprecated
      * @param kernel_buffer [I] Pointer to the pre-allocated memory to store
      *                          kernel Compiler Support object
      * @param input         [I] TensorIterator object containing input Tensor shape and
@@ -1291,11 +1291,38 @@ class KernelsFactory {
      */
     virtual lib_mli::TransposeConv2D_CS* TransposeConv2D_CS(
         void *kernel_buffer,
-        const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& input,    // BHWC
+        const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& input,    // BHWGCi
         const TensorIterator<NoBuffer, kTransposeConvWRank, kTransposeConvWIterRank>& weights,    // GHWCiCo
         const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvZPIterRank>& weights_zp,
         const TransposeConv2DConfig &cfg,
-        const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& output) { // BHWC
+        const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& output) { // BHWGCo
+        return nullptr;
+    }
+
+    /**
+     * @brief Transpose Convolution 2D kernel Compiler Support interface factory
+     * method
+     * @param kernel_buffer [I] Pointer to the pre-allocated memory to store
+     *                          kernel Compiler Support object
+     * @param input         [I] TensorIterator object containing input Tensor shape and
+     *                          memory strides and IteratorCfg
+     * @param input_zp      [I] TensorIterator object containing input zp(s) array
+     * @param weights       [I] TensorIterator object containing weights Tensor shape
+     *                          and memory strides and IteratorCfg
+     * @param weights_zp    [I] TensorIterator object containing weight zp(s) array
+     * @param cfg           [I] Kernel configuration structure
+     * @param output        [I] TensorIterator object containing output Tensor shape
+     *                          and memory strides and IteratorCfg
+     *
+     * @return Transpose Convolution 2D kernel Compiler Support interface object
+     */
+    virtual lib_mli::TransposeConv2D_CS* TransposeConv2D_CS(void* kernel_buffer,
+                                                            const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& input,      // BHWGCi
+                                                            const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvIterRank>& input_zp,
+                                                            const TensorIterator<NoBuffer, kTransposeConvWRank, kTransposeConvWIterRank>& weights,      // GHWCiCo
+                                                            const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvZPIterRank>& weights_zp,
+                                                            const TransposeConv2DConfig& cfg,
+                                                            const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& output) {   // BHWGCo
         return nullptr;
     }
 
diff --git a/include/mli_kernels_factory_ref.hpp b/include/mli_kernels_factory_ref.hpp
@@ -338,6 +338,9 @@ class KernelsFactory : public lib_mli::KernelsFactory {
 
     uint32_t TransposeConv2D_CS_GetSize() const override { return sizeof(lib_ref::TransposeConv2D_CS); }
 
+    /**
+     * @deprecated
+     */
     lib_mli::TransposeConv2D_CS* TransposeConv2D_CS(
         void *kernel_buffer,
         const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank> &input,
@@ -348,6 +351,16 @@ class KernelsFactory : public lib_mli::KernelsFactory {
         return new (kernel_buffer)lib_ref::TransposeConv2D_CS(m_pd, input, weights, weights_zp, cfg, output);
     }
 
+    virtual lib_mli::TransposeConv2D_CS* TransposeConv2D_CS(void* kernel_buffer,
+                                                            const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& input,
+                                                            const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvIterRank>& input_zp,
+                                                            const TensorIterator<NoBuffer, kTransposeConvWRank, kTransposeConvWIterRank>& weights,
+                                                            const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvZPIterRank>& weights_zp,
+                                                            const TransposeConv2DConfig& cfg,
+                                                            const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& output) override {
+        return new (kernel_buffer)lib_ref::TransposeConv2D_CS(m_pd, input, input_zp, weights, weights_zp, cfg, output);
+    }
+
     uint32_t Permute_CS_GetSize() const override { return sizeof(lib_ref::Permute_CS); }
 
     lib_mli::Permute_CS* Permute_CS(void *kernel_buffer,
diff --git a/include/mli_types.hpp b/include/mli_types.hpp
@@ -85,11 +85,11 @@ constexpr unsigned kDepthwiseZPRank = 1;  // TODO: remove and use kWZPRank inste
 constexpr unsigned kDepthwiseIterRank = 5;
 
 constexpr unsigned kTransposeConvIORank = 5;
-constexpr unsigned kTransposeConvIOIterRank = 5;
+constexpr unsigned kTransposeConvIOIterRank = 5;  // TODO: remove and use kTransposeConvIterRank instead
 constexpr unsigned kTransposeConvWRank = 5;
-constexpr unsigned kTransposeConvWIterRank = 5;
-constexpr unsigned kTransposeConvZPRank = 1;  // TODO: remove and use kWZPRank instead
-constexpr unsigned kTransposeConvZPIterRank = 5;
+constexpr unsigned kTransposeConvWIterRank = 5;   // TODO: remove and use kTransposeConvIterRank instead
+constexpr unsigned kTransposeConvZPRank = 1;      // TODO: remove and use kWZPRank instead
+constexpr unsigned kTransposeConvZPIterRank = 5;  // TODO: remove and use kTransposeConvIterRank instead
 constexpr unsigned kTransposeConvIterRank = 5;
 
 constexpr unsigned kFullyConnectedIORank = 2;
diff --git a/lib/src/kernels/convolution/mli_krn_transpose_conv_compiler.cc b/lib/src/kernels/convolution/mli_krn_transpose_conv_compiler.cc
@@ -16,8 +16,11 @@
 
 namespace snps_arc::metaware::mli::ref {
 
+/**
+ * @deprecated
+ */
 TransposeConv2D_CS::TransposeConv2D_CS(
-    const lib_mli::PlatformDescription pd,
+    const PlatformDescription pd,
     const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank> &input,
     const TensorIterator<NoBuffer, kTransposeConvWRank, kTransposeConvWIterRank> &weights,
     const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvZPIterRank> &weights_zp,
@@ -29,36 +32,48 @@ TransposeConv2D_CS::TransposeConv2D_CS(
       m_output(output),
       m_config(cfg),
       m_pd(pd) {
+  DEPRECATED_METHOD
   m_inp_quant_axis = kPerTensorQuantDim;
   m_wts_quant_axis = kKernelChannelOutDim;
+  m_weights_buffer_size = service::GetBufferSize(weights.get_tensor());
+}
+
+TransposeConv2D_CS::TransposeConv2D_CS(const PlatformDescription pd,
+                                       const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIterRank>& input,
+                                       const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvIterRank>& input_zp,
+                                       const TensorIterator<NoBuffer, kTransposeConvWRank, kTransposeConvIterRank>& weights,
+                                       const TensorIterator<NoBuffer, kTransposeConvZPRank, kTransposeConvIterRank>& weights_zp,
+                                       const TransposeConv2DConfig& cfg,
+                                       const TensorIterator<NoBuffer, kTransposeConvIORank, kTransposeConvIOIterRank>& output)
+  : m_input(input),
+    m_weights(weights),
+    m_weights_zp(weights_zp),
+    m_output(output),
+    m_config(cfg),
+    m_pd(pd) {
+  m_inp_quant_axis = kPerTensorQuantDim;
+  m_wts_quant_axis = kKernelChannelOutDim;
+  m_weights_buffer_size = service::GetBufferSize(weights.get_tensor());
 }
 
 unsigned TransposeConv2D_CS::GetKernelPrivateDataSize() const {
   return sizeof(TransposeConv2DPrivateData);
 }
 
 unsigned TransposeConv2D_CS::GetRuntimeObjectSize() const {
-  return sizeof(Conv2d);
+  return sizeof(TransposeConv2D);
 }
 
 mli_status TransposeConv2D_CS::GetKernelPrivateData(
     void *kernel_private_data_buffer) {
-  MLI_ASSERT(kernel_private_data_buffer != nullptr);
-
-  // Batch checking
-  MLI_ASSERT(m_input.get_dim(mli::kGroupTensorBatchDim) == 1);
-
-  // Channel checking
-  MLI_ASSERT(m_weights.get_dim(mli::kKernelChannelOutDim) ==
-      m_output.get_dim(mli::kGroupTensorChannelDim));
-
-  MLI_ASSERT(m_weights.get_dim(mli::kKernelChannelInDim) ==
-      m_input.get_dim(mli::kGroupTensorChannelDim));
 
-  // Group checking
-  MLI_ASSERT(m_weights.get_dim(mli::kKernelGroupDim) == 1);
-
-  MLI_ASSERT(m_weights.get_dim(mli::kKernelGroupDim) == 1);
+  MLI_ASSERT(kernel_private_data_buffer != nullptr);
+  MLI_ASSERT(m_input.get_dim(kGroupTensorBatchDim) == 1);
+  MLI_ASSERT(m_weights.get_dim(kKernelChannelOutDim) ==
+      m_output.get_dim(kGroupTensorChannelDim));
+  MLI_ASSERT(m_weights.get_dim(kKernelChannelInDim) ==
+      m_input.get_dim(kGroupTensorChannelDim));
+  MLI_ASSERT(m_weights.get_dim(kKernelGroupDim) == 1);
 
   TransposeConv2DPrivateData prv_data;
   prv_data.input = m_input;
@@ -88,31 +103,60 @@ mli_status TransposeConv2D_CS::AttachBufferOffsets(
   return MLI_STATUS_OK;
 }
 
+/**
+ * @deprecated
+ */
 mli_status TransposeConv2D_CS::EncodeWeights(Tensor<Buffer, kTransposeConvWRank> &weights,
                                              Buffer &encoded_weights,
                                              compression_mode_t mode) {
+  DEPRECATED_METHOD
   return service::EncodeWeights(weights, encoded_weights);
 }
 
+mli_status TransposeConv2D_CS::EncodeWeightsAndZeroPts(TensorIterator<Buffer, kTransposeConvWRank, kTransposeConvIterRank>& weights,
+                                                       TensorIterator<Buffer, kTransposeConvZPRank, kTransposeConvIterRank>& weights_zp,
+                                                       Buffer& encoded_weights) {
+  return service::EncodeWeightsAndZeroPts(weights.get_tensor(), weights_zp.get_tensor(), encoded_weights);
+};
+
+unsigned TransposeConv2D_CS::GetEncodedWeightsSize() const {
+  return m_weights_buffer_size;
+};
+
+/**
+ * @deprecated
+ */
 mli_status TransposeConv2D_CS::EncodeInpZeroPts(Tensor<Buffer, kTransposeConvZPRank> &inpzeropts,
                                                 Buffer &encoded_inpzeropts) {
-  constexpr int channel_axis = mli::kTensorChannelDim;
+  DEPRECATED_METHOD
+  constexpr int channel_axis = kTensorChannelDim;
   uint32_t channel_length = m_input.get_dim(channel_axis);
   return service::EncodeZeroPts<channel_axis>(
     inpzeropts, encoded_inpzeropts, m_inp_quant_axis, channel_length);
 }
 
+mli_status TransposeConv2D_CS::EncodeInpZeroPts(TensorIterator<Buffer, kTransposeConvZPRank, kTransposeConvZPIterRank>& input_zp,
+                                                Buffer& encoded_input_zp) {
+  constexpr int channel_axis = kTensorChannelDim;
+  uint32_t channel_length = m_input.get_dim(channel_axis);
+  return service::EncodeZeroPts<channel_axis>(input_zp.get_tensor(), encoded_input_zp, m_inp_quant_axis, channel_length);
+}
+
+/**
+ * @deprecated
+ */
 mli_status TransposeConv2D_CS::EncodeWtsZeroPts(Tensor<Buffer, kTransposeConvZPRank> &wtszeropts,
                                                 Buffer &encoded_wtszeropts) {
-  constexpr int channel_axis = mli::kKernelChannelOutDim;
+  DEPRECATED_METHOD
+  constexpr int channel_axis = kKernelChannelOutDim;
   uint32_t channel_length = m_weights.get_dim(channel_axis);
   return service::EncodeZeroPts<channel_axis>(wtszeropts, encoded_wtszeropts,
                                               m_wts_quant_axis, channel_length);
 }
 
 unsigned TransposeConv2D_CS::GetEncodedWtsZeroPtsSize() const {
   // per-channel quantization
-  return m_weights.get_dim(mli::kKernelChannelOutDim) ;
+  return m_weights.get_dim(kKernelChannelOutDim);
 }
 
 unsigned TransposeConv2D_CS::GetEncodedInpZeroPtsSize() const {
diff --git a/user_tests/tests/mli_krn_transpose_conv2d_30/tests_mli_krn_transpose_conv2d_30.cc b/user_tests/tests/mli_krn_transpose_conv2d_30/tests_mli_krn_transpose_conv2d_30.cc