evquantize: saturate 8 biy support

vera121 · vera121 · commit fd69f052dc0e · 2018-12-27T23:16:55.000-05:00
diff --git a/include/caffe/util/math_functions.hpp b/include/caffe/util/math_functions.hpp
@@ -202,9 +202,15 @@ void caffe_gpu_int(const int N, Dtype* y);
 template <typename Dtype>
 void caffe_gpu_signed_saturate(const int N, Dtype* y);
 
+template <typename Dtype>
+void caffe_gpu_signed_8bit_saturate(const int N, Dtype* y);
+
 template <typename Dtype>
 void caffe_gpu_unsigned_saturate(const int N, Dtype* y);
 
+template <typename Dtype>
+void caffe_gpu_unsigned_8bit_saturate(const int N, Dtype* y);
+
 template <typename Dtype>
 void caffe_gpu_add(const int N, const Dtype* a, const Dtype* b, Dtype* y);
 
diff --git a/src/caffe/layers/conv_layer.cu b/src/caffe/layers/conv_layer.cu
@@ -39,6 +39,10 @@ void ConvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_signed_saturate(count_t, top_data);
     if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned)
       caffe_gpu_unsigned_saturate(count_t, top_data);
+    if(saturate ==  ConvolutionParameter_SaturateMethod_Signed_8bit)
+      caffe_gpu_signed_8bit_saturate(count_t, top_data);
+    if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned_8bit)
+      caffe_gpu_unsigned_8bit_saturate(count_t, top_data);
     //CUSTOMIZATION-->
   }
 }
diff --git a/src/caffe/layers/deconv_layer.cu b/src/caffe/layers/deconv_layer.cu
@@ -38,6 +38,10 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_signed_saturate(count_t, top_data);
     if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned)
       caffe_gpu_unsigned_saturate(count_t, top_data);
+    if(saturate ==  ConvolutionParameter_SaturateMethod_Signed_8bit)
+      caffe_gpu_signed_8bit_saturate(count_t, top_data);
+    if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned_8bit)
+      caffe_gpu_unsigned_8bit_saturate(count_t, top_data);
     //CUSTOMIZATION-->
   }
 }
diff --git a/src/caffe/layers/eltwise_layer.cu b/src/caffe/layers/eltwise_layer.cu
@@ -59,6 +59,10 @@ void EltwiseLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_signed_saturate(count, top_data);
     if(saturate_ ==  EltwiseParameter_SaturateMethod_Unsigned)
       caffe_gpu_unsigned_saturate(count, top_data);
+    if(saturate_ ==  EltwiseParameter_SaturateMethod_Signed_8bit)
+      caffe_gpu_signed_8bit_saturate(count, top_data);
+    if(saturate_ ==  EltwiseParameter_SaturateMethod_Unsigned_8bit)
+      caffe_gpu_unsigned_8bit_saturate(count, top_data);
     //CUSTOMIZATION-->
     break;
   case EltwiseParameter_EltwiseOp_MAX:
diff --git a/src/caffe/layers/pooling_layer.cu b/src/caffe/layers/pooling_layer.cu
@@ -8,6 +8,9 @@
 #define SIGNED_SATURATE_MAX 2047
 #define SIGNED_SATURATE_MIN -2048
 #define UNSIGNED_SATURATE_MAX 4095
+#define SIGNED_8BIT_SATURATE_MAX 127
+#define SIGNED_8BIT_SATURATE_MIN -128
+#define UNSIGNED_8BIT_SATURATE_MAX 255
 
 namespace caffe {
 
@@ -97,13 +100,27 @@ __global__ void AvePoolForward(const int nthreads,
         if(top_data[index] < 0)
           top_data[index] = 0;
       }
+      if(saturate ==  PoolingParameter_SaturateMethod_Unsigned_8bit)
+      {
+        if(top_data[index] > UNSIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = UNSIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < 0)
+          top_data[index] = 0;
+      }
       if(saturate ==  PoolingParameter_SaturateMethod_Signed)
       {
         if(top_data[index] > SIGNED_SATURATE_MAX)
           top_data[index] = SIGNED_SATURATE_MAX;
         if(top_data[index] < SIGNED_SATURATE_MIN)
           top_data[index] = SIGNED_SATURATE_MIN;
       }
+      if(saturate ==  PoolingParameter_SaturateMethod_Signed_8bit)
+      {
+        if(top_data[index] > SIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = SIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < SIGNED_8BIT_SATURATE_MIN)
+          top_data[index] = SIGNED_8BIT_SATURATE_MIN;
+      }
     }
     else{
       if(saturate ==  PoolingParameter_SaturateMethod_Unsigned)
@@ -114,6 +131,14 @@ __global__ void AvePoolForward(const int nthreads,
         if(top_data[index] < 0)
           top_data[index] = 0;
       }
+      else if(saturate ==  PoolingParameter_SaturateMethod_Unsigned_8bit)
+      {
+        top_data[index] = aveval;
+        if(top_data[index] > UNSIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = UNSIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < 0)
+          top_data[index] = 0;
+      }
       else if(saturate ==  PoolingParameter_SaturateMethod_Signed)
       {
         top_data[index] = aveval;
@@ -122,6 +147,14 @@ __global__ void AvePoolForward(const int nthreads,
         if(top_data[index] < SIGNED_SATURATE_MIN)
           top_data[index] = SIGNED_SATURATE_MIN;
       }
+      else if(saturate ==  PoolingParameter_SaturateMethod_Signed_8bit)
+      {
+        top_data[index] = aveval;
+        if(top_data[index] > SIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = SIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < SIGNED_8BIT_SATURATE_MIN)
+          top_data[index] = SIGNED_8BIT_SATURATE_MIN;
+      }
       else //original implementation
         top_data[index] = aveval / pool_size;
     }
@@ -248,13 +281,27 @@ __global__ void AvePoolForward_TF(const int nthreads,
         if(top_data[index] < 0)
           top_data[index] = 0;
       }
+      if(saturate ==  PoolingParameter_SaturateMethod_Unsigned_8bit)
+      {
+        if(top_data[index] > UNSIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = UNSIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < 0)
+          top_data[index] = 0;
+      }
       if(saturate ==  PoolingParameter_SaturateMethod_Signed)
       {
         if(top_data[index] > SIGNED_SATURATE_MAX)
           top_data[index] = SIGNED_SATURATE_MAX;
         if(top_data[index] < SIGNED_SATURATE_MIN)
           top_data[index] = SIGNED_SATURATE_MIN;
       }
+      if(saturate ==  PoolingParameter_SaturateMethod_Signed_8bit)
+      {
+        if(top_data[index] > SIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = SIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < SIGNED_8BIT_SATURATE_MIN)
+          top_data[index] = SIGNED_8BIT_SATURATE_MIN;
+      }
     }
 
     else{
@@ -266,6 +313,14 @@ __global__ void AvePoolForward_TF(const int nthreads,
         if(top_data[index] < 0)
           top_data[index] = 0;
       }
+      else if(saturate ==  PoolingParameter_SaturateMethod_Unsigned_8bit)
+      {
+      	top_data[index] = aveval;
+        if(top_data[index] > UNSIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = UNSIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < 0)
+          top_data[index] = 0;
+      }
       else if(saturate ==  PoolingParameter_SaturateMethod_Signed)
       {
         top_data[index] = aveval;
@@ -274,6 +329,14 @@ __global__ void AvePoolForward_TF(const int nthreads,
         if(top_data[index] < SIGNED_SATURATE_MIN)
           top_data[index] = SIGNED_SATURATE_MIN;
       }
+      else if(saturate ==  PoolingParameter_SaturateMethod_Signed_8bit)
+      {
+        top_data[index] = aveval;
+        if(top_data[index] > SIGNED_8BIT_SATURATE_MAX)
+          top_data[index] = SIGNED_8BIT_SATURATE_MAX;
+        if(top_data[index] < SIGNED_8BIT_SATURATE_MIN)
+          top_data[index] = SIGNED_8BIT_SATURATE_MIN;
+      }
       else //original implementation
         top_data[index] = aveval / pool_size;
     }
diff --git a/src/caffe/layers/relu_layer.cu b/src/caffe/layers/relu_layer.cu
@@ -6,6 +6,9 @@
 #define SIGNED_SATURATE_MAX 2047
 #define SIGNED_SATURATE_MIN -2048
 #define UNSIGNED_SATURATE_MAX 4095
+#define SIGNED_8BIT_SATURATE_MAX 127
+#define SIGNED_8BIT_SATURATE_MIN -128
+#define UNSIGNED_8BIT_SATURATE_MAX 255
 
 namespace caffe {
 
@@ -25,10 +28,22 @@ __global__ void ReLUForward(const int n, const Dtype* in, Dtype* out,
       if(out[index] < SIGNED_SATURATE_MIN)
         out[index] = SIGNED_SATURATE_MIN;
     }
+    if(saturate ==  ReLUParameter_SaturateMethod_Signed_8bit){
+      if(out[index] < 0) //only need to do the round when multiplied with negative_slope
+        out[index] = rint(out[index]);
+      if(out[index] > SIGNED_8BIT_SATURATE_MAX)
+        out[index] = SIGNED_8BIT_SATURATE_MAX;
+      if(out[index] < SIGNED_8BIT_SATURATE_MIN)
+        out[index] = SIGNED_8BIT_SATURATE_MIN;
+    }
     if(saturate ==  ReLUParameter_SaturateMethod_Unsigned){
       if(out[index] > UNSIGNED_SATURATE_MAX)
         out[index] = UNSIGNED_SATURATE_MAX;
     }
+    if(saturate ==  ReLUParameter_SaturateMethod_Unsigned_8bit){
+      if(out[index] > UNSIGNED_8BIT_SATURATE_MAX)
+        out[index] = UNSIGNED_8BIT_SATURATE_MAX;
+    }
     //CUSTOMIZATION-->
   }
 }
diff --git a/src/caffe/proto/caffe.proto b/src/caffe/proto/caffe.proto
@@ -1303,6 +1303,8 @@ message ConvolutionParameter {
     None = 0;
     Signed = 1;
     Unsigned = 2;
+    Signed_8bit = 3;
+    Unsigned_8bit = 4;
   }
   optional SaturateMethod saturate = 32 [default = None]; //control the output in certain range
   //CUSTOMIZATION-->
@@ -1616,6 +1618,8 @@ message EltwiseParameter {
     None = 0;
     Signed = 1;
     Unsigned = 2;
+    Signed_8bit = 3;
+    Unsigned_8bit = 4;
   }
   optional SaturateMethod saturate = 5 [default = None]; //only valid for SUM, control the output in certain range
   //CUSTOMIZATION-->
@@ -1984,6 +1988,8 @@ message PoolingParameter {
     None = 0;
     Signed = 1;
     Unsigned = 2;
+    Signed_8bit = 3;
+    Unsigned_8bit = 4;
   }
   optional SaturateMethod saturate = 22 [default = None]; //control the output in certain range
   //CUSTOMIZATION-->
@@ -2123,6 +2129,8 @@ message ReLUParameter {
     None = 0;
     Signed = 1;
     Unsigned = 2;
+    Signed_8bit = 3;
+    Unsigned_8bit = 4;
   }
   optional SaturateMethod saturate = 4 [default = None]; //control the output in certain range
   //CUSTOMIZATION-->
@@ -2348,6 +2356,8 @@ message SqueezeConvolutionParameter {
     None = 0;
     Signed = 1;
     Unsigned = 2;
+    Signed_8bit = 3;
+    Unsigned_8bit = 4;
   }
   optional SaturateMethod saturate = 48 [default = None]; //act as dummy param in squeeze_conv layer now
   //CUSTOMIZATION-->
diff --git a/src/caffe/util/math_functions.cu b/src/caffe/util/math_functions.cu
@@ -11,6 +11,9 @@
 #define SIGNED_SATURATE_MAX 2047
 #define SIGNED_SATURATE_MIN -2048
 #define UNSIGNED_SATURATE_MAX 4095
+#define SIGNED_8BIT_SATURATE_MAX 127
+#define SIGNED_8BIT_SATURATE_MIN -128
+#define UNSIGNED_8BIT_SATURATE_MAX 255
 
 namespace caffe {
 
@@ -224,6 +227,28 @@ void caffe_gpu_signed_saturate<double>(const int N, double* y) {
   signed_saturate_kernel<double><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
 }
 
+template <typename Dtype>
+__global__ void signed_8bit_saturate_kernel(const int n, Dtype* y) {
+  CUDA_KERNEL_LOOP(index, n) {
+    if(y[index] > SIGNED_8BIT_SATURATE_MAX)
+      y[index] = SIGNED_8BIT_SATURATE_MAX;
+    if(y[index] < SIGNED_8BIT_SATURATE_MIN)
+      y[index] = SIGNED_8BIT_SATURATE_MIN;
+  }
+}
+
+template <>
+void caffe_gpu_signed_8bit_saturate<float>(const int N, float* y) {
+  // NOLINT_NEXT_LINE(whitespace/operators)
+  signed_8bit_saturate_kernel<float><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+}
+
+template <>
+void caffe_gpu_signed_8bit_saturate<double>(const int N, double* y) {
+  // NOLINT_NEXT_LINE(whitespace/operators)
+  signed_8bit_saturate_kernel<double><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+}
+
 template <typename Dtype>
 __global__ void unsigned_saturate_kernel(const int n, Dtype* y) {
   CUDA_KERNEL_LOOP(index, n) {
@@ -246,6 +271,29 @@ void caffe_gpu_unsigned_saturate<double>(const int N, double* y) {
   unsigned_saturate_kernel<double><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
 }
 
+
+template <typename Dtype>
+__global__ void unsigned_8bit_saturate_kernel(const int n, Dtype* y) {
+  CUDA_KERNEL_LOOP(index, n) {
+    if(y[index] > UNSIGNED_8BIT_SATURATE_MAX)
+      y[index] = UNSIGNED_8BIT_SATURATE_MAX;
+    if(y[index] < 0)
+      y[index] = 0;
+  }
+}
+
+template <>
+void caffe_gpu_unsigned_8bit_saturate<float>(const int N, float* y) {
+  // NOLINT_NEXT_LINE(whitespace/operators)
+  unsigned_8bit_saturate_kernel<float><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+}
+
+template <>
+void caffe_gpu_unsigned_8bit_saturate<double>(const int N, double* y) {
+  // NOLINT_NEXT_LINE(whitespace/operators)
+  unsigned_8bit_saturate_kernel<double><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(N, y);
+}
+
 template <typename Dtype>
 __global__ void set_kernel(const int n, const Dtype alpha, Dtype* y) {
   CUDA_KERNEL_LOOP(index, n) {

Original file line number	Diff line number	Diff line change
`@@ -39,6 +39,10 @@ void ConvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,`
`39`	`39`	`caffe_gpu_signed_saturate(count_t, top_data);`
`40`	`40`	`if(saturate == ConvolutionParameter_SaturateMethod_Unsigned)`
`41`	`41`	`caffe_gpu_unsigned_saturate(count_t, top_data);`
	`42`	`+ if(saturate == ConvolutionParameter_SaturateMethod_Signed_8bit)`
	`43`	`+ caffe_gpu_signed_8bit_saturate(count_t, top_data);`
	`44`	`+ if(saturate == ConvolutionParameter_SaturateMethod_Unsigned_8bit)`
	`45`	`+ caffe_gpu_unsigned_8bit_saturate(count_t, top_data);`
`42`	`46`	`//CUSTOMIZATION-->`
`43`	`47`	`}`
`44`	`48`	`}`
Original file line number	Diff line number	Diff line change
`@@ -38,6 +38,10 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,`
`38`	`38`	`caffe_gpu_signed_saturate(count_t, top_data);`
`39`	`39`	`if(saturate == ConvolutionParameter_SaturateMethod_Unsigned)`
`40`	`40`	`caffe_gpu_unsigned_saturate(count_t, top_data);`
	`41`	`+ if(saturate == ConvolutionParameter_SaturateMethod_Signed_8bit)`
	`42`	`+ caffe_gpu_signed_8bit_saturate(count_t, top_data);`
	`43`	`+ if(saturate == ConvolutionParameter_SaturateMethod_Unsigned_8bit)`
	`44`	`+ caffe_gpu_unsigned_8bit_saturate(count_t, top_data);`
`41`	`45`	`//CUSTOMIZATION-->`
`42`	`46`	`}`
`43`	`47`	`}`