blaze_hailo: Update to support face detection/landmarks models.

AlbertaBeef · AlbertaBeef · commit 52da64cce201 · 2024-03-05T10:08:02.000-05:00
diff --git a/blaze_detect_live.py b/blaze_detect_live.py
@@ -191,10 +191,13 @@ def get_video_dev_by_name(src):
     { "blaze": "face", "pipeline": "tfl_face_v0_10_sparse", "model1": "blaze_tflite/models/face_detection_full_range_sparse.tflite", "model2": "blaze_tflite/models/face_landmark.tflite" },
     { "blaze": "face", "pipeline": "pyt_face_v0_07_front" , "model1": "blaze_pytorch/models/blazeface.pth",                          "model2": "blaze_pytorch/models/blazeface_landmark.pth" },
     { "blaze": "face", "pipeline": "pyt_face_v0_07_back"  , "model1": "blaze_pytorch/models/blazefaceback.pth",                      "model2": "blaze_pytorch/models/blazeface_landmark.pth" },
+    { "blaze": "face", "pipeline": "hai_face_v0_10_short" , "model1": "blaze_hailo/models/face_detection_short_range.hef",           "model2": "blaze_hailo/models/face_landmark.hef" },
+    { "blaze": "face", "pipeline": "hai_face_v0_10_full"  , "model1": "blaze_hailo/models/face_detection_full_range.hef",            "model2": "blaze_hailo/models/face_landmark.hef" },
     { "blaze": "pose", "pipeline": "tfl_pose_v0_10_lite"  , "model1": "blaze_tflite/models/pose_detection.tflite",                   "model2": "blaze_tflite/models/pose_landmark_lite.tflite" },
     { "blaze": "pose", "pipeline": "tfl_pose_v0_10_full"  , "model1": "blaze_tflite/models/pose_detection.tflite",                   "model2": "blaze_tflite/models/pose_landmark_full.tflite" },
     { "blaze": "pose", "pipeline": "tfl_pose_v0_10_heavy" , "model1": "blaze_tflite/models/pose_detection.tflite",                   "model2": "blaze_tflite/models/pose_landmark_heavy.tflite" },
-    { "blaze": "pose", "pipeline": "pyt_pose_v0_06"       , "model1": "blaze_pytorch/models/blazepose.pth",                          "model2": "blaze_pytorch/models/blazepose_landmark.pth" }
+    { "blaze": "pose", "pipeline": "pyt_pose_v0_06"       , "model1": "blaze_pytorch/models/blazepose.pth",                          "model2": "blaze_pytorch/models/blazepose_landmark.pth" },
+    { "blaze": "pose", "pipeline": "hai_pose_v0_10_lite"  , "model1": "blaze_tflite/models/pose_detection.tflite",                   "model2": "blaze_hailo/models/pose_landmark_lite.hef" }
 ]
 nb_blaze_pipelines = len(blaze_pipelines)
 
diff --git a/blaze_hailo/blazedetector.py b/blaze_hailo/blazedetector.py
@@ -81,14 +81,8 @@ def load_model(self, model_path):
             # Conv__543 [1x36x16x16] =transpose=> [1x16x16x36] =reshape=> [1x512x18]    => [1x2944x18]
             # Conv__550 [1x36x32x32] =transpose=> [1x32x32x36] =reshape=> [1x2048x1]  //
             if self.blaze_app == "blazepalm" and self.num_outputs == 6:
-
                 self.outputShape1 = tuple((1,2944,1))
                 self.outputShape2 = tuple((1,2944,18))
-            
-                if self.DEBUG:
-                    print("[BlazeDetector.load_model] Input Shape : ",self.inputShape)
-                    print("[BlazeDetector.load_model] Output1 Shape : ",self.outputShape1)
-                    print("[BlazeDetector.load_model] Output2 Shape : ",self.outputShape2)
 
             ### palm_detection_lite/full
             # Conv__410 [1x2x24x24] =transpose=> [1x24x24x2] =reshape=> [1x1152x1] \\
@@ -99,14 +93,24 @@ def load_model(self, model_path):
             #                                                                             => [1x2016x18]
             # Conv__411 [1x108x12x12] =transpose=> [1x12x12x108] =reshape=> [1x864x18]  //
             if self.blaze_app == "blazepalm" and self.num_outputs == 4:
-
                 self.outputShape1 = tuple((1,2016,1))
                 self.outputShape2 = tuple((1,2016,18))
+
+            # face_detection_short_range
+            if self.blaze_app == "blazeface" and self.num_outputs == 4:
+                self.outputShape1 = tuple((1,896,1))
+                self.outputShape2 = tuple((1,896,16))
             
-                if self.DEBUG:
-                    print("[BlazeDetector.load_model] Input Shape : ",self.inputShape)
-                    print("[BlazeDetector.load_model] Output1 Shape : ",self.outputShape1)
-                    print("[BlazeDetector.load_model] Output2 Shape : ",self.outputShape2)
+            # face_detection_full_range
+            if self.blaze_app == "blazeface" and self.num_outputs == 2:
+                self.outputShape1 = tuple((1,2304,1))
+                self.outputShape2 = tuple((1,2304,16))
+
+        if self.DEBUG:
+            print("[BlazeDetector.load_model] Input Shape : ",self.inputShape)
+            print("[BlazeDetector.load_model] Output1 Shape : ",self.outputShape1)
+            print("[BlazeDetector.load_model] Output2 Shape : ",self.outputShape2)
+
             
         self.x_scale = self.inputShape[1]
         self.y_scale = self.inputShape[2]
@@ -279,6 +283,60 @@ def predict_on_batch(self, x):
             concat_1_2016_18 = np.concatenate((reshape_1_1152_18,reshape_1_864_18),axis=1)
 
             out2 = concat_1_2016_18.astype(np.float32)
+
+        ### face_detection_short_range
+        #[BlazeDetector.load_model] Model File :  blaze_hailo/models/face_detection_short_range.hef
+        #[BlazeDetector.load_model] HEF Id :  0
+        #[BlazeDetector.load_model] Input VStream Infos :  [VStreamInfo("face_detection_short_range/input_layer1")]
+        #[BlazeDetector.load_model] Output VStream Infos :  [VStreamInfo("face_detection_short_range/conv21"), VStreamInfo("face_detection_short_range/conv14"), VStreamInfo("face_detection_short_range/conv20"), VStreamInfo("face_detection_short_range/conv13")]
+        #[BlazeDetector.load_model] Number of Inputs :  1
+        #[BlazeDetector.load_model] Input[ 0 ] Shape :  (128, 128, 3)  Name :  face_detection_short_range/input_layer1
+        #[BlazeDetector.load_model] Number of Outputs :  4
+        #[BlazeDetector.load_model] Output[ 0 ] Shape :  (8, 8, 96)  Name :  face_detection_short_range/conv21
+        #[BlazeDetector.load_model] Output[ 1 ] Shape :  (16, 16, 32)  Name :  face_detection_short_range/conv14
+        #[BlazeDetector.load_model] Output[ 2 ] Shape :  (8, 8, 6)  Name :  face_detection_short_range/conv20
+        #[BlazeDetector.load_model] Output[ 3 ] Shape :  (16, 16, 2)  Name :  face_detection_short_range/conv13
+        if self.blaze_app == "blazeface" and self.num_outputs == 4:
+            transpose_1_16_16_2 = infer_results[self.output_vstream_infos[3].name]
+            transport_1_8_8_6 = infer_results[self.output_vstream_infos[2].name]
+            
+            reshape_1_512_1 = transpose_1_16_16_2.reshape(1,512,1)
+            reshape_1_384_1 = transport_1_8_8_6.reshape(1,384,1)
+
+            concat_1_896_1 = np.concatenate((reshape_1_512_1,reshape_1_384_1),axis=1)
+
+            out1 = concat_1_896_1.astype(np.float32)
+
+            transpose_1_16_16_32 = infer_results[self.output_vstream_infos[1].name]
+            transport_8_8_96 = infer_results[self.output_vstream_infos[0].name]
+            
+            reshape_1_512_16 = transpose_1_16_16_32.reshape(1,512,16)
+            reshape_1_384_16 = transport_8_8_96.reshape(1,384,16)
+
+            concat_1_896_16 = np.concatenate((reshape_1_512_16,reshape_1_384_16),axis=1)
+
+            out2 = concat_1_896_16.astype(np.float32)
+
+        ### face_detection_full_range
+        #[BlazeDetector.load_model] Model File :  blaze_hailo/models/face_detection_full_range.hef
+        #[BlazeDetector.load_model] HEF Id :  0
+        #[BlazeDetector.load_model] Input VStream Infos :  [VStreamInfo("face_detection_full_range/input_layer1")]
+        #[BlazeDetector.load_model] Output VStream Infos :  [VStreamInfo("face_detection_full_range/conv49"), VStreamInfo("face_detection_full_range/conv48")]
+        #[BlazeDetector.load_model] Number of Inputs :  1
+        #[BlazeDetector.load_model] Input[ 0 ] Shape :  (192, 192, 3)  Name :  face_detection_full_range/input_layer1
+        #[BlazeDetector.load_model] Number of Outputs :  2
+        #[BlazeDetector.load_model] Output[ 0 ] Shape :  (48, 48, 16)  Name :  face_detection_full_range/conv49
+        #[BlazeDetector.load_model] Output[ 1 ] Shape :  (48, 48, 1)  Name :  face_detection_full_range/conv48
+        if self.blaze_app == "blazeface" and self.num_outputs == 2:
+            transpose_1_48_48_1 = infer_results[self.output_vstream_infos[1].name]
+            transpose_1_48_48_16 = infer_results[self.output_vstream_infos[0].name]
+
+            reshape_1_2304_1 = transpose_1_48_48_1.reshape(1,2304,1)
+            reshape_1_2304_16 = transpose_1_48_48_16.reshape(1,2304,16)
+        
+            out1 = reshape_1_2304_1.astype(np.float32)
+            out2 = reshape_1_2304_16.astype(np.float32)
+           
             
         #if self.DEBUG:
         #    print("[BlazeDetector.load_model] Input   : ",x.shape, x.dtype, x)
diff --git a/blaze_hailo/blazelandmark.py b/blaze_hailo/blazelandmark.py
@@ -45,8 +45,6 @@ def load_model(self, model_path):
             if self.DEBUG:
                 print("[BlazeLandmark.load_model] Input VStream Infos : ",self.input_vstream_infos)
                 print("[BlazeLandmark.load_model] Output VStream Infos : ",self.output_vstream_infos)
-                #[BlazeLandmark.load_model] Input VStream Infos :  [VStreamInfo("hand_landmark_lite/input_layer1")]
-                #[BlazeLandmark.load_model] Output VStream Infos :  [VStreamInfo("hand_landmark_lite/fc1"), VStreamInfo("hand_landmark_lite/fc3"), VStreamInfo("hand_landmark_lite/fc2"), VStreamInfo("hand_landmark_lite/fc4")]
 
             # Get input/output tensors dimensions
             self.num_inputs = len(self.input_vstream_infos)
@@ -58,25 +56,26 @@ def load_model(self, model_path):
                 print("[BlazeLandmark.load_model] Number of Outputs : ",self.num_outputs)
                 for i in range(self.num_outputs):
                     print("[BlazeLandmark.load_model] Output[",i,"] Shape : ",tuple(self.output_vstream_infos[i].shape))
-                #[BlazeLandmark.load_model] Number of Inputs :  1
-                #[BlazeLandmark.load_model] Input[ 0 ] Shape :  (224, 224, 3)
-                #[BlazeLandmark.load_model] Number of Outputs :  4
-                #[BlazeLandmark.load_model] Output[ 0 ] Shape :  (63,)
-                #[BlazeLandmark.load_model] Output[ 1 ] Shape :  (63,)
-                #[BlazeLandmark.load_model] Output[ 2 ] Shape :  (1,)
-                #[BlazeLandmark.load_model] Output[ 3 ] Shape :  (1,)
 
-            self.inputShape = self.input_vstream_infos[0].shape
-            self.outputShape1 = tuple(self.output_vstream_infos[2].shape)
-            self.outputShape2 = tuple(self.output_vstream_infos[0].shape)
+            if self.blaze_app == "blazehandlandmark":
+                self.inputShape = self.input_vstream_infos[0].shape
+                self.outputShape1 = tuple(self.output_vstream_infos[2].shape)
+                self.outputShape2 = tuple(self.output_vstream_infos[0].shape)
+
+            if self.blaze_app == "blazefacelandmark":
+                self.inputShape = self.input_vstream_infos[0].shape
+                self.outputShape1 = tuple(self.output_vstream_infos[0].shape)
+                self.outputShape2 = tuple(self.output_vstream_infos[1].shape)
+
+            if self.blaze_app == "blazeposelandmark":
+                self.inputShape = self.input_vstream_infos[0].shape
+                self.outputShape1 = tuple(self.output_vstream_infos[0].shape)
+                self.outputShape2 = tuple(self.output_vstream_infos[1].shape)
 
             if self.DEBUG:
                 print("[BlazeLandmark.load_model] Input Shape : ",self.inputShape)
                 print("[BlazeLandmark.load_model] Output1 Shape : ",self.outputShape1)
                 print("[BlazeLandmark.load_model] Output2 Shape : ",self.outputShape2)
-                #[BlazeLandmark.load_model] Input Shape :  (224, 224, 3)
-                #[BlazeLandmark.load_model] Output1 Shape :  (63,)
-                #[BlazeLandmark.load_model] Output2 Shape :  (63,)
 
         self.resolution = self.inputShape[1]
         if self.DEBUG:
@@ -117,19 +116,49 @@ def predict(self, x):
             start = timer()  
 
             if self.blaze_app == "blazehandlandmark":
+                #[BlazeLandmark.load_model] Model File :  blaze_hailo/models/hand_landmark_lite.hef
+                #[BlazeLandmark.load_model] Input VStream Infos :  [VStreamInfo("hand_landmark_lite/input_layer1")]
+                #[BlazeLandmark.load_model] Output VStream Infos :  [VStreamInfo("hand_landmark_lite/fc1"), VStreamInfo("hand_landmark_lite/fc4"), VStreamInfo("hand_landmark_lite/fc3"), VStreamInfo("hand_landmark_lite/fc2")]
+                #[BlazeLandmark.load_model] Number of Inputs :  1
+                #[BlazeLandmark.load_model] Input[ 0 ] Shape :  (224, 224, 3)
+                #[BlazeLandmark.load_model] Number of Outputs :  4
+                #[BlazeLandmark.load_model] Output[ 0 ] Shape :  (63,)
+                #[BlazeLandmark.load_model] Output[ 1 ] Shape :  (1,)
+                #[BlazeLandmark.load_model] Output[ 2 ] Shape :  (1,)
+                #[BlazeLandmark.load_model] Output[ 3 ] Shape :  (63,)
                 out1 = infer_results[self.output_vstream_infos[2].name]
                 handedness = infer_results[self.output_vstream_infos[3].name] 
                 out2 = infer_results[self.output_vstream_infos[0].name]
                 out2 = out2.reshape(1,21,-1) # 42 => [1,21,2] | 63 => [1,21,3]
                 out2 = out2/self.resolution
             elif self.blaze_app == "blazefacelandmark":
+                #[BlazeLandmark.load_model] Model File :  blaze_hailo/models/face_landmark.hef
+                #[BlazeLandmark.load_model] Input VStream Infos :  [VStreamInfo("face_landmark/input_layer1")]
+                #[BlazeLandmark.load_model] Output VStream Infos :  [VStreamInfo("face_landmark/conv23"), VStreamInfo("face_landmark/conv25")]
+                #[BlazeLandmark.load_model] Number of Inputs :  1
+                #[BlazeLandmark.load_model] Input[ 0 ] Shape :  (192, 192, 3)
+                #[BlazeLandmark.load_model] Number of Outputs :  2
+                #[BlazeLandmark.load_model] Output[ 0 ] Shape :  (1, 1, 1)
+                #[BlazeLandmark.load_model] Output[ 1 ] Shape :  (1, 1, 1404)
+                #[BlazeLandmark.load_model] Input Shape :  (192, 192, 3)
                 out1 = infer_results[self.output_vstream_infos[0].name]
                 out2 = infer_results[self.output_vstream_infos[1].name]
                 out2 = out2.reshape(1,-1,3) # 1404 => [1,356,3]
                 out2 = out2/self.resolution                 
             elif self.blaze_app == "blazeposelandmark":
-                out1 = infer_results[self.output_vstream_infos[0].name]
-                out2 = infer_results[self.output_vstream_infos[1].name]
+                #[BlazeLandmark.load_model] Model File :  blaze_hailo/models/pose_landmark_lite.hef
+                #[BlazeLandmark.load_model] Input VStream Infos :  [VStreamInfo("pose_landmark_lite/input_layer1")]
+                #[BlazeLandmark.load_model] Output VStream Infos :  [VStreamInfo("pose_landmark_lite/conv46"), VStreamInfo("pose_landmark_lite/conv45"), VStreamInfo("pose_landmark_lite/conv54"), VStreamInfo("pose_landmark_lite/conv48"), VStreamInfo("pose_landmark_lite/conv47")]
+                #[BlazeLandmark.load_model] Number of Inputs :  1
+                #[BlazeLandmark.load_model] Input[ 0 ] Shape :  (256, 256, 3)
+                #[BlazeLandmark.load_model] Number of Outputs :  5
+                #[BlazeLandmark.load_model] Output[ 0 ] Shape :  (1, 1, 195)
+                #[BlazeLandmark.load_model] Output[ 1 ] Shape :  (1, 1, 1)
+                #[BlazeLandmark.load_model] Output[ 2 ] Shape :  (256, 256, 1)
+                #[BlazeLandmark.load_model] Output[ 3 ] Shape :  (64, 64, 39)
+                #[BlazeLandmark.load_model] Output[ 4 ] Shape :  (1, 1, 117)            
+                out1 = infer_results[self.output_vstream_infos[1].name]
+                out2 = infer_results[self.output_vstream_infos[0].name]
                 out2 = out2.reshape(1,-1,5) # 195 => [1,39,5]
                 out2 = out2/self.resolution  
                 
diff --git a/blaze_hailo/models/get_hailo_models.sh b/blaze_hailo/models/get_hailo_models.sh