evquantize: fix for the signed/unnsigned saturate for conv, deconv, eltwise

vera121 · vera121 · commit ae3b171df674 · 2018-12-13T03:48:53.000-05:00
diff --git a/include/caffe/layers/base_conv_layer.hpp b/include/caffe/layers/base_conv_layer.hpp
@@ -103,7 +103,7 @@ class BaseConvolutionLayer : public Layer<Dtype> {
 
   Dtype input_scale_; //CUSTOMIZATION
   Dtype output_scale_; //CUSTOMIZATION
-  bool signed_saturate_; //CUSTOMIZATION
+  Dtype saturate_; //CUSTOMIZATION
 
  private:
   // wrap im2col/col2im so we don't have to remember the (long) argument lists
diff --git a/include/caffe/layers/eltwise_layer.hpp b/include/caffe/layers/eltwise_layer.hpp
@@ -45,7 +45,7 @@ class EltwiseLayer : public Layer<Dtype> {
 
   bool stable_prod_grad_;
   Dtype output_scale_;  //CUSTOMIZATION
-  bool signed_saturate_; //CUSTOMIZATION
+  Dtype saturate_; //CUSTOMIZATION
 };
 
 }  // namespace caffe
diff --git a/include/caffe/util/math_functions.hpp b/include/caffe/util/math_functions.hpp
@@ -200,7 +200,10 @@ template <typename Dtype>
 void caffe_gpu_int(const int N, Dtype* y);
 
 template <typename Dtype>
-void caffe_gpu_saturate(const int N, Dtype* y);
+void caffe_gpu_signed_saturate(const int N, Dtype* y);
+
+template <typename Dtype>
+void caffe_gpu_unsigned_saturate(const int N, Dtype* y);
 
 template <typename Dtype>
 void caffe_gpu_add(const int N, const Dtype* a, const Dtype* b, Dtype* y);
diff --git a/src/caffe/layers/base_conv_layer.cpp b/src/caffe/layers/base_conv_layer.cpp
@@ -88,7 +88,7 @@ void BaseConvolutionLayer<Dtype>::LayerSetUpInternal(LayerParam conv_param,
 	output_scale_ = 1;
   }
 
-  signed_saturate_ = conv_param.signed_saturate();
+  saturate_ = conv_param.saturate();
   //CUSTOMIZATION-->
 
   // Setup pad dimensions (pad_).
diff --git a/src/caffe/layers/conv_layer.cu b/src/caffe/layers/conv_layer.cu
@@ -11,7 +11,7 @@ void ConvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
   const Dtype* weight = this->blobs_[0]->gpu_data();
   Dtype input_scale = this->input_scale_; //CUSTOMIZATION
   Dtype output_scale = this->output_scale_; //CUSTOMIZATION
-  bool signed_saturate = this->signed_saturate_; //CUSTOMIZATION
+  Dtype saturate = this->saturate_; //CUSTOMIZATION
   for (int i = 0; i < bottom.size(); ++i) {
     Dtype* bottom_data = bottom[i]->mutable_gpu_data();
     //<--CUSTOMIZATION
@@ -35,8 +35,10 @@ void ConvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_scal(count_t, output_scale, top_data);
       caffe_gpu_round(count_t, top_data);
     }
-    if (signed_saturate)
-      caffe_gpu_saturate(count_t, top_data);
+    if(saturate ==  ReLUParameter_SaturateMethod_Signed)
+      caffe_gpu_signed_saturate(count_t, top_data);
+    if(saturate ==  ReLUParameter_SaturateMethod_Unsigned)
+      caffe_gpu_unsigned_saturate(count_t, top_data);
     //CUSTOMIZATION-->
   }
 }
diff --git a/src/caffe/layers/deconv_layer.cu b/src/caffe/layers/deconv_layer.cu
@@ -10,6 +10,7 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
   const Dtype* weight = this->blobs_[0]->gpu_data();
   Dtype input_scale = this->input_scale_; //CUSTOMIZATION
   Dtype output_scale = this->output_scale_; //CUSTOMIZATION
+  Dtype saturate = this->saturate_; //CUSTOMIZATION
   for (int i = 0; i < bottom.size(); ++i) {
     Dtype* bottom_data = bottom[i]->mutable_gpu_data();
     //<--CUSTOMIZATION
@@ -33,6 +34,10 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_scal(count_t, output_scale, top_data);
       caffe_gpu_round(count_t, top_data);
     }
+    if(saturate ==  ReLUParameter_SaturateMethod_Signed)
+      caffe_gpu_signed_saturate(count_t, top_data);
+    if(saturate ==  ReLUParameter_SaturateMethod_Unsigned)
+      caffe_gpu_unsigned_saturate(count_t, top_data);
     //CUSTOMIZATION-->
   }
 }
diff --git a/src/caffe/layers/eltwise_layer.cpp b/src/caffe/layers/eltwise_layer.cpp
@@ -26,7 +26,7 @@ void EltwiseLayer<Dtype>::LayerSetUp(const vector<Blob<Dtype>*>& bottom,
   }
   stable_prod_grad_ = this->layer_param_.eltwise_param().stable_prod_grad();
   output_scale_ = this->layer_param_.eltwise_param().output_scale();
-  signed_saturate_ = this->layer_param_.eltwise_param().signed_saturate();
+  saturate_ = this->layer_param_.eltwise_param().saturate();
 }
 
 template <typename Dtype>
diff --git a/src/caffe/layers/eltwise_layer.cu b/src/caffe/layers/eltwise_layer.cu
@@ -4,9 +4,6 @@
 #include "caffe/layers/eltwise_layer.hpp"
 #include "caffe/util/math_functions.hpp"
 
-#define SIGNED_SATURATE_MAX 2047
-#define SIGNED_SATURATE_MIN -2048
-
 namespace caffe {
 
 template <typename Dtype>
@@ -57,9 +54,11 @@ void EltwiseLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
     if (output_scale_ != Dtype(1)) {
       caffe_gpu_scal(count, output_scale_, top_data);
       caffe_gpu_round(count, top_data);
-    if (signed_saturate_)
-      caffe_gpu_saturate(count, top_data);
     }
+    if(saturate_ ==  ReLUParameter_SaturateMethod_Signed)
+      caffe_gpu_signed_saturate(count, top_data);
+    if(saturate_ ==  ReLUParameter_SaturateMethod_Unsigned)
+      caffe_gpu_unsigned_saturate(count, top_data);
     //CUSTOMIZATION-->
     break;
   case EltwiseParameter_EltwiseOp_MAX:
diff --git a/src/caffe/proto/caffe.proto b/src/caffe/proto/caffe.proto
@@ -1298,7 +1298,14 @@ message ConvolutionParameter {
 
   optional double input_scale = 30 [default = 1]; //CUSTOMIZATION
   optional double output_scale = 31 [default = 1]; //CUSTOMIZATION
-  optional bool signed_saturate = 32 [default = false]; //CUSTOMIZATION
+  //<--CUSTOMIZATION
+  enum SaturateMethod {
+    None = 0;
+    Signed = 1;
+    Unsigned = 2;
+  }
+  optional SaturateMethod saturate = 32 [default = None]; //control the output in certain range
+  //CUSTOMIZATION-->
 
   optional uint32 group = 5 [default = 1]; // The group size for group conv
 
@@ -1604,7 +1611,14 @@ message EltwiseParameter {
   // of computing the gradient for the PROD operation. (No effect for SUM op.)
   optional bool stable_prod_grad = 3 [default = true];
   optional double output_scale = 4 [default = 1]; //CUSTOMIZATION, only valid for SUM
-  optional bool signed_saturate = 5 [default = false]; //CUSTOMIZATION, only valid for SUM
+  //<--CUSTOMIZATION
+  enum SaturateMethod {
+    None = 0;
+    Signed = 1;
+    Unsigned = 2;
+  }
+  optional SaturateMethod saturate = 5 [default = None]; //only valid for SUM, control the output in certain range
+  //CUSTOMIZATION-->
 }
 
 // Message that stores parameters used by ELULayer
@@ -2322,7 +2336,14 @@ message SqueezeConvolutionParameter {
 
   optional double input_scale = 46 [default = 1]; //CUSTOMIZATION, act as dummy param in squeeze_conv layer now
   optional double output_scale = 47 [default = 1]; //CUSTOMIZATION, act as dummy param in squeeze_conv layer now
-  optional bool signed_saturate = 48 [default = false]; //CUSTOMIZATION, act as dummy param in squeeze_conv layer now
+  //<--CUSTOMIZATION
+  enum SaturateMethod {
+    None = 0;
+    Signed = 1;
+    Unsigned = 2;
+  }
+  optional SaturateMethod saturate = 48 [default = None]; //act as dummy param in squeeze_conv layer now
+  //CUSTOMIZATION-->
 
   optional uint32 group = 5 [default = 1]; // The group size for group conv
 
diff --git a/src/caffe/util/math_functions.cu b/src/caffe/util/math_functions.cu
@@ -10,6 +10,7 @@
 
 #define SIGNED_SATURATE_MAX 2047
 #define SIGNED_SATURATE_MIN -2048
+#define UNSIGNED_SATURATE_MAX 4095
 
 namespace caffe {
 
@@ -202,7 +203,7 @@ void caffe_gpu_int<double>(const int N, double* y) {
 }
 
 template <typename Dtype>
-__global__ void saturate_kernel(const int n, Dtype* y) {
+__global__ void signed_saturate_kernel(const int n, Dtype* y) {
   CUDA_KERNEL_LOOP(index, n) {
     if(y[index] > SIGNED_SATURATE_MAX)
       y[index] = SIGNED_SATURATE_MAX;
@@ -212,15 +213,35 @@ __global__ void saturate_kernel(const int n, Dtype* y) {
 }
 
 template <>
-void caffe_gpu_saturate<float>(const int N, float* y) {
+void caffe_gpu_signed_saturate<float>(const int N, float* y) {
   // NOLINT_NEXT_LINE(whitespace/operators)
-  saturate_kernel<float><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+  signed_saturate_kernel<float><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
 }
 
 template <>
-void caffe_gpu_saturate<double>(const int N, double* y) {
+void caffe_gpu_signed_saturate<double>(const int N, double* y) {
   // NOLINT_NEXT_LINE(whitespace/operators)
-  saturate_kernel<double><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+  signed_saturate_kernel<double><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+}
+
+template <typename Dtype>
+__global__ void unsigned_saturate_kernel(const int n, Dtype* y) {
+  CUDA_KERNEL_LOOP(index, n) {
+    if(y[index] > UNSIGNED_SATURATE_MAX)
+      y[index] = SIGNED_SATURATE_MAX;
+  }
+}
+
+template <>
+void caffe_gpu_unsigned_saturate<float>(const int N, float* y) {
+  // NOLINT_NEXT_LINE(whitespace/operators)
+  unsigned_saturate_kernel<float><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+}
+
+template <>
+void caffe_gpu_unsigned_saturate<double>(const int N, double* y) {
+  // NOLINT_NEXT_LINE(whitespace/operators)
+  unsigned_saturate_kernel<double><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
 }
 
 template <typename Dtype>

Original file line number	Diff line number	Diff line change
`@@ -88,7 +88,7 @@ void BaseConvolutionLayer<Dtype>::LayerSetUpInternal(LayerParam conv_param,`
`88`	`88`	`output_scale_ = 1;`
`89`	`89`	`}`
`90`	`90`
`91`		`- signed_saturate_ = conv_param.signed_saturate();`
	`91`	`+ saturate_ = conv_param.saturate();`
`92`	`92`	`//CUSTOMIZATION-->`
`93`	`93`
`94`	`94`	`// Setup pad dimensions (pad_).`
Original file line number	Diff line number	Diff line change
`@@ -10,6 +10,7 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,`
`10`	`10`	`const Dtype* weight = this->blobs_[0]->gpu_data();`
`11`	`11`	`Dtype input_scale = this->input_scale_; //CUSTOMIZATION`
`12`	`12`	`Dtype output_scale = this->output_scale_; //CUSTOMIZATION`
	`13`	`+ Dtype saturate = this->saturate_; //CUSTOMIZATION`
`13`	`14`	`for (int i = 0; i < bottom.size(); ++i) {`
`14`	`15`	`Dtype* bottom_data = bottom[i]->mutable_gpu_data();`
`15`	`16`	`//<--CUSTOMIZATION`
`@@ -33,6 +34,10 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,`
`33`	`34`	`caffe_gpu_scal(count_t, output_scale, top_data);`
`34`	`35`	`caffe_gpu_round(count_t, top_data);`
`35`	`36`	`}`
	`37`	`+ if(saturate == ReLUParameter_SaturateMethod_Signed)`
	`38`	`+ caffe_gpu_signed_saturate(count_t, top_data);`
	`39`	`+ if(saturate == ReLUParameter_SaturateMethod_Unsigned)`
	`40`	`+ caffe_gpu_unsigned_saturate(count_t, top_data);`
`36`	`41`	`//CUSTOMIZATION-->`
`37`	`42`	`}`
`38`	`43`	`}`
Original file line number	Diff line number	Diff line change
`@@ -26,7 +26,7 @@ void EltwiseLayer<Dtype>::LayerSetUp(const vector<Blob<Dtype>*>& bottom,`
`26`	`26`	`}`
`27`	`27`	`stable_prod_grad_ = this->layer_param_.eltwise_param().stable_prod_grad();`
`28`	`28`	`output_scale_ = this->layer_param_.eltwise_param().output_scale();`
`29`		`- signed_saturate_ = this->layer_param_.eltwise_param().signed_saturate();`
	`29`	`+ saturate_ = this->layer_param_.eltwise_param().saturate();`
`30`	`30`	`}`
`31`	`31`
`32`	`32`	`template <typename Dtype>`