Implement Sparse Face Detection Model (#212)

ShikharJ · web-flow · commit ce9ea3f9f82e · 2020-10-25T20:25:12.000-07:00
* Port Sparse Model

* Incorporate Harsha's Comments

* Add make clean argument
diff --git a/.gitattributes b/.gitattributes
@@ -1,6 +1,5 @@
 # Set the default behavior, in case people don't have core.autocrlf set.
 * text=auto
-
 # Explicitly declare text files you want to always be normalized and converted
 # to native line endings on checkout.
 *.c text
@@ -11,17 +10,14 @@
 *.hh text
 *.mk text
 *.md text
-
 # Declare files that will always have CRLF line endings on checkout.
 *.sln text eol=crlf
 *.vcxproj text eol=crlf
-
 # Denote all files that are truly binary and should not be modified.
 *.png binary
 *.jpg binary
 *.pdf binary
 *.ipynb binary
-
 c_reference/models/q_scut_head_b_face3_model/mbconv1.h filter=lfs diff=lfs merge=lfs -text
 c_reference/models/q_scut_head_b_face3_model/mbconv3.h filter=lfs diff=lfs merge=lfs -text
 c_reference/models/q_scut_head_b_face3_model/mbconv4.h filter=lfs diff=lfs merge=lfs -text
@@ -53,3 +49,14 @@ c_reference/models/q_scut_head_b_face2_model/mbconv13.h filter=lfs diff=lfs merg
 c_reference/models/q_scut_head_b_face2_model/mbconv1.h filter=lfs diff=lfs merge=lfs -text
 c_reference/models/q_scut_head_b_face2_model/detection2.h filter=lfs diff=lfs merge=lfs -text
 c_reference/models/q_scut_head_b_face2_model/mbconv12.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/detection1.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/detection3.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/detection4.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/mbconv3.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/rnn1.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/conv2D.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/mbconv1.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/mbconv2.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/mbconv4.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/rnn2.h filter=lfs diff=lfs merge=lfs -text
+c_reference/models/q_scut_head_b_face4_model/detection2.h filter=lfs diff=lfs merge=lfs -text
diff --git a/c_reference/include/quantized_fastgrnn.h b/c_reference/include/quantized_fastgrnn.h
@@ -159,10 +159,15 @@ int q15_fastgrnn_lr(Q15_T* const hiddenState, ITER_T hiddenDims,
 
 /**
  * @brief Model paramters for FastGRNN
+ * Note: Wids, Wvals, Uids, Uvals can be set to NULL for non-sparse mode operation
  * @var       mean         pointer to mean of input vector for normalization, size inputDims
  * @var       stdDev       pointer to standard dev of input for normalization, size inputDims * steps
  * @var       W            pointer to W matrix
+ * @var       Wids         pointer to the matrix storing row-indices of non-zero elements of W
+ * @var       Wvals        pointer to the matrix storing the non-zero elements of W
  * @var       U            pointer U matrix
+ * @var       Uids         pointer to the matrix storing row-indices of non-zero elements of U
+ * @var       Uvals        pointer to the matrix storing the non-zero elements of U
  * @var       Bg           pointer to bias for Sigmoid
  * @var       Bh           pointer to bias for TanH
  * @var       sigmoid_zeta first weight parameter for update from input from next step
@@ -172,7 +177,11 @@ typedef struct Q15_FastGRNN_Params {
   const Q15_T* mean;
   const Q15_T* stdDev;
   const Q15_T* W;
+  const ITER_T* Wids;
+  const Q15_T* Wvals;
   const Q15_T* U;
+  const ITER_T* Uids;
+  const Q15_T* Uvals;
   const Q15_T* Bg;
   const Q15_T* Bh;
   Q15_T sigmoid_zeta;
@@ -183,7 +192,11 @@ typedef struct Q7xQ15_FastGRNN_Params {
   const Q7_T* mean;
   const Q7_T* stdDev;
   const Q15_T* W;
+  const ITER_T* Wids;
+  const Q15_T* Wvals;
   const Q15_T* U;
+  const ITER_T* Uids;
+  const Q15_T* Uvals;
   const Q15_T* Bg;
   const Q15_T* Bh;
   Q15_T sigmoid_zeta;
diff --git a/c_reference/include/quantized_utils.h b/c_reference/include/quantized_utils.h
@@ -304,6 +304,45 @@ void q15xq7_q15_m_mulvec(const Q15_T* mat, const Q7_T* const vec, ITER_T nrows,
 void q15_m_mulvec(const Q15_T* mat, const Q15_T* const vec, ITER_T nrows,
                   ITER_T ncols, Q15_T* ret, SCALE_T scmat, SCALE_T scvec,
                   SCALE_T H1, SCALE_T H2);
+/**
+ * @brief Performs sparse matrix multiplication of a matrix and a vector.
+ * row_indices and mat_values combined are a sparse representation; dim(vec) = [ncols].
+ * mat_values[i] is the i^th non-zero value of the input matrix, and row_indices[i] encodes the (1-indexed) row location of mat_values[i].
+ * If number of zeroes before row_indices[i] is l, then l is the column location of the (i-l)th matrix value.
+ * @param[in]       row_indices  pointer to input matrix which stores the row indices of non-zero values of matrix A
+ * @param[in]       mat_values   pointer to input matrix which stores the non-zero values of matrix A
+ * @param[in]       vec          pointer to the input vector
+ * @param[in]       nrows        number of rows of the input matrix
+ * @param[in]       ncols        number of columns of the input matrix
+ * @param[out]      ret          pointer to the output vector
+ * @param[in]       scmat        scale factor of the input matrix
+ * @param[in]       scvec        scale factor of the input vector
+ * @param[in]       H1           depth parameter for division-by-two used in TreeSum
+ * @param[in]       H2           depth parameter for direct sum used in TreeSum
+ * @return          none
+ * @example         mat          = { {23, 32, 0},
+ *                                   {0, 0, 1},
+ *                                   {48, 0, 0}}
+ *                  row_indices  = {1, 3, 0, 1, 0, 2, 0}
+ *                  mat_values   = {23, 48, 32, 1}
+ *                  vec          = {1, 2, 3}
+ *                  nrows        = 3
+ *                  ncols        = 3
+ *                  scmat        = 1
+ *                  scvec        = 1
+ *                  H1           = 1
+ *                  H2           = 0
+ *                  ret          = {87, 3, 48}
+ */
+void q15xq7_q15_m_sparse_mulvec(const ITER_T* row_indices,
+                                const Q15_T* mat_values, const Q7_T* vec,
+                                ITER_T nrows, ITER_T ncols, Q15_T* ret,
+                                SCALE_T scmat, SCALE_T scvec, SCALE_T H1,
+                                SCALE_T H2);
+void q15_m_sparse_mulvec(const ITER_T* row_indices, const Q15_T* mat_values,
+                         const Q15_T* vec, ITER_T nrows, ITER_T ncols,
+                         Q15_T* ret, SCALE_T scmat, SCALE_T scvec, SCALE_T H1,
+                         SCALE_T H2);
 
 /**
  * @brief Performs the element-wise addition of two input tensors.
diff --git a/c_reference/models/Makefile b/c_reference/models/Makefile
@@ -6,14 +6,17 @@ include ../config.mk
 INCLUDE_DIR=../include
 IFLAGS = -I $(INCLUDE_DIR)
 
-all: quantized_face_detection.o quantized_face_detection_fast.o
+all: quantized_face_detection.o quantized_face_detection_fast.o quantized_face_detection_sparse.o
 
 quantized_face_detection.o: quantized_face_detection.c
 	$(CC) -o $@ $(IFLAGS) $(CFLAGS) -c $^
 
 quantized_face_detection_fast.o: quantized_face_detection_fast.c
 	$(CC) -o $@ $(IFLAGS) $(CFLAGS) -c $^
 
+quantized_face_detection_sparse.o: quantized_face_detection_sparse.c
+	$(CC) -o $@ $(IFLAGS) $(CFLAGS) -c $^
+
 .PHONY: clean cleanest
 
 clean: 
diff --git a/c_reference/models/q_scut_head_b_face2_model/rnn1.h b/c_reference/models/q_scut_head_b_face2_model/rnn1.h
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3386605f719f98078e9dd47e74353a08ab2d57d57a226b5e9663850a6d2bcb8
-size 5833
+oid sha256:455faca056eaec8069e17ed4829c5f6f4e513c972fd569e659c08e5a95b03d2e
+size 5908
diff --git a/c_reference/models/q_scut_head_b_face2_model/rnn2.h b/c_reference/models/q_scut_head_b_face2_model/rnn2.h
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c26d12688e8264c0580b83b0c3043007a8872e855235d24d858926512ca4d890
-size 6997
+oid sha256:2132f05705188ae5008d6f43120c625c5995bb4133aff4327e4232edeb3baac1
+size 7073
diff --git a/c_reference/models/q_scut_head_b_face3_model/rnn1.h b/c_reference/models/q_scut_head_b_face3_model/rnn1.h
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:40d453b1415418d36529cc645885ab3ce220de744826d32b5563464bf09a6570
-size 5853
+oid sha256:fbe2ceaa3e3cce2a7fc844311b0be170fd703f9ed0cb9ac4f41ecfc600bb0f53
+size 5928
diff --git a/c_reference/models/q_scut_head_b_face3_model/rnn2.h b/c_reference/models/q_scut_head_b_face3_model/rnn2.h
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c3b5c16018b7dffcab15060f1f13e592b07487b77765213e64ebb31e366c2ef6
-size 6941
+oid sha256:ff0b4a711a06ed71e8bbf1682c4d9f7ee17d25cca7f291c9a4b3347daae52e6f
+size 7017
diff --git a/c_reference/models/q_scut_head_b_face4_model/conv2D.h b/c_reference/models/q_scut_head_b_face4_model/conv2D.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:334038e066c40017acf7dee0d8ebcb1072968f1ac289e398908c70936d182f71
+size 2289
diff --git a/c_reference/models/q_scut_head_b_face4_model/detection1.h b/c_reference/models/q_scut_head_b_face4_model/detection1.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:953b19e45354a3b3796db7f658915ea160a468de30830117c3998d0d10c17e35
+size 17457
diff --git a/c_reference/models/q_scut_head_b_face4_model/detection2.h b/c_reference/models/q_scut_head_b_face4_model/detection2.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:f60eee6de074686538e2eda54b10dfd2b66a2a4094e1afeca96fbdc1a9f46bff
+size 13652
diff --git a/c_reference/models/q_scut_head_b_face4_model/detection3.h b/c_reference/models/q_scut_head_b_face4_model/detection3.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:778f7380a5cfe4967bbe248d61f1f9d69a6bfb4586dbf22f9f407e9b3faa350c
+size 24485
diff --git a/c_reference/models/q_scut_head_b_face4_model/detection4.h b/c_reference/models/q_scut_head_b_face4_model/detection4.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:9d611675cb485772e8b042634f60f3a5348ccf4c494b41865d2d687f94160ae4
+size 23742
diff --git a/c_reference/models/q_scut_head_b_face4_model/mbconv1.h b/c_reference/models/q_scut_head_b_face4_model/mbconv1.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:352eb393d95d887d476f771cdf02efed787c54897b88ba6ed0edb859cbc619df
+size 91064
diff --git a/c_reference/models/q_scut_head_b_face4_model/mbconv2.h b/c_reference/models/q_scut_head_b_face4_model/mbconv2.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:e72f1e22521bf73b977175a21c14c2795e81d109d4f96f92dd159c27a94f82e4
+size 34097
diff --git a/c_reference/models/q_scut_head_b_face4_model/mbconv3.h b/c_reference/models/q_scut_head_b_face4_model/mbconv3.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:6dd6fb42774d0bf290a94425e587ea254ff60e9dd9eaf88f73223e18c3a8f8d8
+size 47490
diff --git a/c_reference/models/q_scut_head_b_face4_model/mbconv4.h b/c_reference/models/q_scut_head_b_face4_model/mbconv4.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:440b5fb6c96cf447543cdbe33aa871ff56ed0a8af05f97183a0ddf386a2edffd
+size 116764
diff --git a/c_reference/models/q_scut_head_b_face4_model/rnn1.h b/c_reference/models/q_scut_head_b_face4_model/rnn1.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:f8144562a7d7cf9bba5f7275695ea5a29fa8b9b58e58afa88c0842009375352d
+size 7161
diff --git a/c_reference/models/q_scut_head_b_face4_model/rnn2.h b/c_reference/models/q_scut_head_b_face4_model/rnn2.h
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:d246659add6478ae9f4daf6fb314867231ef1d2dd5c80251f3a02d9b8525d232
+size 8352
diff --git a/c_reference/models/quantized_face_detection.c b/c_reference/models/quantized_face_detection.c
@@ -81,7 +81,7 @@ void q_face_detection(char* const mem_buf) {
   for (ITER_T i = 0; i < 30; i++) {
     memcpy(&mem_buf_offset_q7[39 * 64 + i * 2560],
            &mem_buf_offset_q7[38 * 64 + i * 2560], 64 * sizeof(Q7_T));
-  } 
+  }
 
   // MBConv Sub-Pipeline
   // MBConv Layer 1
diff --git a/c_reference/models/quantized_face_detection_fast.c b/c_reference/models/quantized_face_detection_fast.c
@@ -111,7 +111,7 @@ void q_face_detection_fast(char* const mem_buf) {
     D1LW_COUT, (Q15_T*)(mem_buf + 2400), D1LB_Scten, D1LB_Scvec, D1LB_Scret);
 
   memset((mem_buf_offset_q15 + 2400), 0, sizeof(Q15_T) * 600);
-  memset(mem_buf_offset_q15 + 3000, 0, sizeof(Q15_T) * 1);
+  memset((mem_buf_offset_q15 + 3000), 0, sizeof(Q15_T) * 1);
   memset((mem_buf_offset_q15 + 3001), 0, sizeof(Q15_T) * 1);
 
   for (ITER_T i = 0; i < 15; i++) {
diff --git a/c_reference/models/quantized_face_detection_sparse.c b/c_reference/models/quantized_face_detection_sparse.c
diff --git a/c_reference/models/quantized_face_detection_sparse.h b/c_reference/models/quantized_face_detection_sparse.h
diff --git a/c_reference/src/quantized_fastgrnn.c b/c_reference/src/quantized_fastgrnn.c
diff --git a/c_reference/src/quantized_utils.c b/c_reference/src/quantized_utils.c
diff --git a/c_reference/tests/Makefile b/c_reference/tests/Makefile
diff --git a/c_reference/tests/face_detection/test_quantized_face_detection_sparse.c b/c_reference/tests/face_detection/test_quantized_face_detection_sparse.c
diff --git a/c_reference/tests/rnnpool/q_wider_regression_model/rnn1.h b/c_reference/tests/rnnpool/q_wider_regression_model/rnn1.h
diff --git a/c_reference/tests/rnnpool/q_wider_regression_model/rnn2.h b/c_reference/tests/rnnpool/q_wider_regression_model/rnn2.h
diff --git a/c_reference/tests/utils/test_quantized_utils.c b/c_reference/tests/utils/test_quantized_utils.c

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+version https://git-lfs.github.com/spec/v1`
	`2`	`+oid sha256:334038e066c40017acf7dee0d8ebcb1072968f1ac289e398908c70936d182f71`
	`3`	`+size 2289`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+version https://git-lfs.github.com/spec/v1`
	`2`	`+oid sha256:953b19e45354a3b3796db7f658915ea160a468de30830117c3998d0d10c17e35`
	`3`	`+size 17457`