Move MatMul to blas_impl.h

reyoung · reyoung · commit 0a13d3c67a7b · 2018-05-08T11:16:36.000+08:00
Rename MatDim to MatDescriptor
diff --git a/paddle/fluid/operators/math/blas.cc b/paddle/fluid/operators/math/blas.cc
@@ -18,8 +18,9 @@
 namespace paddle {
 namespace operators {
 namespace math {
-MatDim GetMatDim(const framework::DDim& dim, int num_flatten_cols, bool trans) {
-  MatDim retv;
+MatDescriptor GetMatDim(const framework::DDim& dim, int num_flatten_cols,
+                        bool trans) {
+  MatDescriptor retv;
   if (num_flatten_cols > 1) {
     auto flatten_dim = framework::flatten_to_2d(dim, num_flatten_cols);
     retv.height_ = flatten_dim[0];
diff --git a/paddle/fluid/operators/math/blas.h b/paddle/fluid/operators/math/blas.h
@@ -46,16 +46,16 @@ namespace paddle {
 namespace operators {
 namespace math {
 
-struct MatDim {
+struct MatDescriptor {
   int64_t height_;
   int64_t width_;
   int64_t stride_{0};
   int64_t batch_size_{0};
   bool trans_;
 };
 
-extern MatDim GetMatDim(const framework::DDim& tensor, int num_flatten_cols,
-                        bool trans);
+extern MatDescriptor GetMatDim(const framework::DDim& tensor,
+                               int num_flatten_cols, bool trans);
 
 template <typename DeviceContext>
 class Blas {
@@ -102,26 +102,9 @@ class Blas {
                    int batchCount, int64_t strideA, int64_t strideB) const;
 
   template <typename T>
-  void MatMul(const framework::Tensor& mat_a, const MatDim& dim_a,
-              const framework::Tensor& mat_b, const MatDim& dim_b, T alpha,
-              framework::Tensor* mat_out, T beta) const {
-    PADDLE_ENFORCE_EQ(dim_a.width_, dim_b.height_);
-    CBLAS_TRANSPOSE transA = !dim_a.trans_ ? CblasNoTrans : CblasTrans;
-    CBLAS_TRANSPOSE transB = !dim_b.trans_ ? CblasNoTrans : CblasTrans;
-    if (dim_a.batch_size_ == 0 && dim_b.batch_size_ == 0) {
-      this->template GEMM<T>(transA, transB, dim_a.height_, dim_b.width_,
-                             dim_a.width_, alpha, mat_a.data<T>(),
-                             mat_b.data<T>(), beta, mat_out->data<T>());
-    } else {
-      PADDLE_ENFORCE(dim_a.batch_size_ == dim_b.batch_size_ ||
-                     dim_a.batch_size_ == 0 || dim_b.batch_size_ == 0);
-      this->template BatchedGEMM<T>(
-          transA, transB, dim_a.height_, dim_b.width_, dim_a.width_, alpha,
-          mat_a.data<T>(), mat_b.data<T>(), beta, mat_out->data<T>(),
-          dim_a.batch_size_ == 0 ? dim_b.batch_size_ : dim_a.batch_size_,
-          dim_a.stride_, dim_b.stride_);
-    }
-  }
+  void MatMul(const framework::Tensor& mat_a, const MatDescriptor& dim_a,
+              const framework::Tensor& mat_b, const MatDescriptor& dim_b,
+              T alpha, framework::Tensor* mat_out, T beta) const;
 
  private:
   const DeviceContext& context_;
diff --git a/paddle/fluid/operators/math/blas_impl.h b/paddle/fluid/operators/math/blas_impl.h
@@ -180,6 +180,31 @@ void Blas<platform::CPUDeviceContext>::BatchedGEMM(
 #endif
 }
 
+template <typename DeviceContext>
+template <typename T>
+void Blas<DeviceContext>::MatMul(const framework::Tensor &mat_a,
+                                 const MatDescriptor &dim_a,
+                                 const framework::Tensor &mat_b,
+                                 const MatDescriptor &dim_b, T alpha,
+                                 framework::Tensor *mat_out, T beta) const {
+  PADDLE_ENFORCE_EQ(dim_a.width_, dim_b.height_);
+  CBLAS_TRANSPOSE transA = !dim_a.trans_ ? CblasNoTrans : CblasTrans;
+  CBLAS_TRANSPOSE transB = !dim_b.trans_ ? CblasNoTrans : CblasTrans;
+  if (dim_a.batch_size_ == 0 && dim_b.batch_size_ == 0) {
+    this->template GEMM<T>(transA, transB, dim_a.height_, dim_b.width_,
+                           dim_a.width_, alpha, mat_a.data<T>(),
+                           mat_b.data<T>(), beta, mat_out->data<T>());
+  } else {
+    PADDLE_ENFORCE(dim_a.batch_size_ == dim_b.batch_size_ ||
+                   dim_a.batch_size_ == 0 || dim_b.batch_size_ == 0);
+    this->template BatchedGEMM<T>(
+        transA, transB, dim_a.height_, dim_b.width_, dim_a.width_, alpha,
+        mat_a.data<T>(), mat_b.data<T>(), beta, mat_out->data<T>(),
+        dim_a.batch_size_ == 0 ? dim_b.batch_size_ : dim_a.batch_size_,
+        dim_a.stride_, dim_b.stride_);
+  }
+}
+
 }  // namespace math
 }  // namespace operators
 }  // namespace paddle
diff --git a/paddle/fluid/operators/matmul_op.h b/paddle/fluid/operators/matmul_op.h
@@ -91,7 +91,7 @@ inline framework::Tensor CombineBatchAndN(const DeviceContext& context,
 }
 
 inline void NormalizeTensorShape(framework::Tensor* x,
-                                 const math::MatDim& mat_dim_x) {
+                                 const math::MatDescriptor& mat_dim_x) {
   int64_t h, w;
   h = mat_dim_x.height_;
   w = mat_dim_x.width_;

Original file line number	Diff line number	Diff line change
`@@ -91,7 +91,7 @@ inline framework::Tensor CombineBatchAndN(const DeviceContext& context,`
`91`	`91`	`}`
`92`	`92`
`93`	`93`	`inline void NormalizeTensorShape(framework::Tensor* x,`
`94`		`- const math::MatDim& mat_dim_x) {`
	`94`	`+ const math::MatDescriptor& mat_dim_x) {`
`95`	`95`	`int64_t h, w;`
`96`	`96`	`h = mat_dim_x.height_;`
`97`	`97`	`w = mat_dim_x.width_;`