Make forward_gpu support quantization parameters, for Conv, Eltwise::SUM layers

snoopyisadog · snoopyisadog · commit dd85dae36835 · 2021-04-01T05:36:45.000+02:00
diff --git a/include/caffe/layers/base_conv_layer.hpp b/include/caffe/layers/base_conv_layer.hpp
@@ -101,6 +101,8 @@ class BaseConvolutionLayer : public Layer<Dtype> {
   int pad_t_; //CUSTOMIZATION
   int pad_b_; //CUSTOMIZATION
 
+  int input_zero_point_; //CUSTOMIZATION
+  int output_zero_point_; //CUSTOMIZATION
   Dtype input_scale_; //CUSTOMIZATION
   Dtype output_scale_; //CUSTOMIZATION
   Dtype saturate_; //CUSTOMIZATION
diff --git a/src/caffe/layers/base_conv_layer.cpp b/src/caffe/layers/base_conv_layer.cpp
@@ -77,15 +77,25 @@ void BaseConvolutionLayer<Dtype>::LayerSetUpInternal(LayerParam conv_param,
   }
 
   //<--CUSTOMIZATION
-  if (conv_param.has_input_scale()){
+  if (conv_param.has_input_scale()) {
     input_scale_ = conv_param.input_scale();
-  } else{
-	input_scale_ = 1;
+  } else {
+    input_scale_ = 1;
+  }
+  if (conv_param.has_input_zero_point()) {
+    input_zero_point_ = conv_param.input_zero_point();
+  } else {
+    input_zero_point_ = 0;
   }
   if (conv_param.has_output_scale()){
     output_scale_ = conv_param.output_scale();
   } else{
-	output_scale_ = 1;
+    output_scale_ = 1;
+  }
+  if (conv_param.has_output_zero_point()) {
+    output_zero_point_ = conv_param.output_zero_point();
+  } else {
+    output_zero_point_ = 0;
   }
 
   saturate_ = conv_param.saturate();
diff --git a/src/caffe/layers/conv_layer.cu b/src/caffe/layers/conv_layer.cu
@@ -11,11 +11,23 @@ void ConvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
   const Dtype* weight = this->blobs_[0]->gpu_data();
   Dtype input_scale = this->input_scale_; //CUSTOMIZATION
   Dtype output_scale = this->output_scale_; //CUSTOMIZATION
+  int input_zero_point = this->input_zero_point_; //CUSTOMIZATION
+  int output_zero_point = this->output_zero_point_; //CUSTOMIZATION
   Dtype saturate = this->saturate_; //CUSTOMIZATION
   for (int i = 0; i < bottom.size(); ++i) {
     Dtype* bottom_data = bottom[i]->mutable_gpu_data();
     //<--CUSTOMIZATION
     const int count_b = bottom[i]->count();
+    /*** Denote input_scale=s0,input_zero_point=z0,input_blob=x0;
+                output_scale=s1,output_zero_point=z1;
+                Weight=W0, Bias=B0, X=Convolution
+        ( (x0-z0)*s0 X W0 + B0 ) / s1 + z1
+      = ( (x0-z0) X W0 + B0/S0)) * s0/s1 + z1
+      Tried both computation, neither achieve bit-wise precision referring to Caffe2
+    ***/
+    if (input_zero_point != 0) {
+      caffe_gpu_add_scalar(count_b, Dtype(-input_zero_point), bottom_data);
+    }
     if (input_scale != Dtype(1)) {
       caffe_gpu_scal(count_b, input_scale, bottom_data);
     }
@@ -35,6 +47,9 @@ void ConvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_scal(count_t, output_scale, top_data);
       caffe_gpu_round(count_t, top_data);
     }
+    if (output_zero_point != 0) {
+      caffe_gpu_add_scalar(count_t, Dtype(output_zero_point), top_data);
+    }
     if(saturate ==  ConvolutionParameter_SaturateMethod_Signed)
       caffe_gpu_signed_saturate(count_t, top_data);
     if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned)
@@ -43,6 +58,17 @@ void ConvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_signed_8bit_saturate(count_t, top_data);
     if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned_8bit)
       caffe_gpu_unsigned_8bit_saturate(count_t, top_data);
+
+    // retrieve the quantized bottom blobs
+    // in case some other layer consumes the same input blob
+    if (input_scale != Dtype(1)) {
+      caffe_gpu_scal(count_b, Dtype(1.0) / input_scale, bottom_data);
+      caffe_gpu_round(count_b, bottom_data);
+    }
+    if (input_zero_point != 0) {
+      caffe_gpu_add_scalar(count_b, Dtype(input_zero_point), bottom_data);
+    }
+    //caffe_gpu_unsigned_8bit_saturate(count_b, bottom_data);
     //CUSTOMIZATION-->
   }
 }
diff --git a/src/caffe/layers/deconv_layer.cu b/src/caffe/layers/deconv_layer.cu
@@ -10,11 +10,16 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
   const Dtype* weight = this->blobs_[0]->gpu_data();
   Dtype input_scale = this->input_scale_; //CUSTOMIZATION
   Dtype output_scale = this->output_scale_; //CUSTOMIZATION
+  int input_zero_point = this->input_zero_point_; //CUSTOMIZATION
+  int output_zero_point = this->output_zero_point_; //CUSTOMIZATION
   Dtype saturate = this->saturate_; //CUSTOMIZATION
   for (int i = 0; i < bottom.size(); ++i) {
     Dtype* bottom_data = bottom[i]->mutable_gpu_data();
     //<--CUSTOMIZATION
     const int count_b = bottom[i]->count();
+    if (input_zero_point != 0) {
+      caffe_gpu_add_scalar(count_b, Dtype(-input_zero_point), bottom_data);
+    }
     if (input_scale != Dtype(1)) {
       caffe_gpu_scal(count_b, input_scale, bottom_data);
     }
@@ -34,6 +39,9 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_scal(count_t, output_scale, top_data);
       caffe_gpu_round(count_t, top_data);
     }
+    if (output_zero_point != 0) {
+      caffe_gpu_add_scalar(count_t, Dtype(output_zero_point), top_data);
+    }
     if(saturate ==  ConvolutionParameter_SaturateMethod_Signed)
       caffe_gpu_signed_saturate(count_t, top_data);
     if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned)
@@ -42,6 +50,13 @@ void DeconvolutionLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_signed_8bit_saturate(count_t, top_data);
     if(saturate ==  ConvolutionParameter_SaturateMethod_Unsigned_8bit)
       caffe_gpu_unsigned_8bit_saturate(count_t, top_data);
+    if (input_scale != Dtype(1)) {
+      caffe_gpu_scal(count_b, Dtype(1.0) / input_scale, bottom_data);
+      caffe_gpu_round(count_b, bottom_data);
+    }
+    if (input_zero_point != 0) {
+      caffe_gpu_add_scalar(count_b, Dtype(input_zero_point), bottom_data);
+    }
     //CUSTOMIZATION-->
   }
 }
diff --git a/src/caffe/layers/eltwise_layer.cu b/src/caffe/layers/eltwise_layer.cu
@@ -73,7 +73,15 @@ void EltwiseLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_mul(count, top_data, bottom[i]->gpu_data(), top_data);
     }
     break;
-  case EltwiseParameter_EltwiseOp_SUM:
+    case EltwiseParameter_EltwiseOp_SUM:
+    //<--CUSTOMIZATION
+    for (int i = 0; i < bottom.size(); ++i) {
+      // input = (bottom - ZeroPoint) * scale; scale is given as coeffs_
+      if (input_zero_point_[i] != 0) {
+        caffe_gpu_add_scalar(count, Dtype(-input_zero_point_[i]), bottom[i]->mutable_gpu_data());
+      }
+    }
+    //CUSTOMIZATION-->
     caffe_gpu_set(count, Dtype(0.), top_data);
     // TODO(shelhamer) does cuBLAS optimize to sum for coeff = 1?
     for (int i = 0; i < bottom.size(); ++i) {
@@ -84,6 +92,10 @@ void EltwiseLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_scal(count, output_scale_, top_data);
       caffe_gpu_round(count, top_data);
     }
+    // output =  top/scale + ZeroPoint
+    if (output_zero_point_ != 0) {
+      caffe_gpu_add_scalar(count, Dtype(output_zero_point_), top_data);
+    }
     if(saturate_ ==  EltwiseParameter_SaturateMethod_Signed)
       caffe_gpu_signed_saturate(count, top_data);
     if(saturate_ ==  EltwiseParameter_SaturateMethod_Unsigned)
@@ -92,6 +104,12 @@ void EltwiseLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,
       caffe_gpu_signed_8bit_saturate(count, top_data);
     if(saturate_ ==  EltwiseParameter_SaturateMethod_Unsigned_8bit)
       caffe_gpu_unsigned_8bit_saturate(count, top_data);
+    // shift the bottom blob back, in case they are input of some other residual connection
+    for (int i = 0; i < bottom.size(); ++i) {
+      if (input_zero_point_[i] != 0) {
+        caffe_gpu_add_scalar(count, Dtype(input_zero_point_[i]), bottom[i]->mutable_gpu_data());
+      }
+    }
     //CUSTOMIZATION-->
     break;
   case EltwiseParameter_EltwiseOp_MAX:
diff --git a/src/caffe/layers/pooling_layer.cu b/src/caffe/layers/pooling_layer.cu
@@ -315,7 +315,7 @@ __global__ void AvePoolForward_TF(const int nthreads,
       }
       else if(saturate ==  PoolingParameter_SaturateMethod_Unsigned_8bit)
       {
-      	top_data[index] = aveval;
+      	top_data[index] = rint(aveval / pool_size);
         if(top_data[index] > UNSIGNED_8BIT_SATURATE_MAX)
           top_data[index] = UNSIGNED_8BIT_SATURATE_MAX;
         if(top_data[index] < 0)
diff --git a/src/caffe/proto/caffe.proto b/src/caffe/proto/caffe.proto
@@ -2583,6 +2583,8 @@ message SqueezeConvolutionParameter {
 
   optional double input_scale = 46 [default = 1]; //CUSTOMIZATION, act as dummy param in squeeze_conv layer now
   optional double output_scale = 47 [default = 1]; //CUSTOMIZATION, act as dummy param in squeeze_conv layer now
+  optional int32 input_zero_point = 49 [default = 0]; //CUSTOMIZATION, act as dummy param in squeeze_conv layer now
+  optional int32 output_zero_point = 50 [default = 0]; //CUSTOMIZATION, act as dummy param in squeeze_conv layer now
   //<--CUSTOMIZATION
   enum SaturateMethod {
     None = 0;

Original file line number	Diff line number	Diff line change
`@@ -315,7 +315,7 @@ __global__ void AvePoolForward_TF(const int nthreads,`
`315`	`315`	`}`
`316`	`316`	`else if(saturate == PoolingParameter_SaturateMethod_Unsigned_8bit)`
`317`	`317`	`{`
`318`		`- top_data[index] = aveval;`
	`318`	`+ top_data[index] = rint(aveval / pool_size);`
`319`	`319`	`if(top_data[index] > UNSIGNED_8BIT_SATURATE_MAX)`
`320`	`320`	`top_data[index] = UNSIGNED_8BIT_SATURATE_MAX;`
`321`	`321`	`if(top_data[index] < 0)`