CoderBotOrg
diff --git a/‎camera.py
Lines changed: 3 additions & 0 deletions b/‎camera.py
Lines changed: 3 additions & 0 deletions
diff --git a/‎cnn_classifier.py
Lines changed: 109 additions & 79 deletions b/‎cnn_classifier.py
Lines changed: 109 additions & 79 deletions
diff --git a/‎cnn_manager.py
Lines changed: 2 additions & 2 deletions b/‎cnn_manager.py
Lines changed: 2 additions & 2 deletions
diff --git a/‎cnn_models/models.json
Lines changed: 1 addition & 1 deletion b/‎cnn_models/models.json
Lines changed: 1 addition & 1 deletion
diff --git a/‎coderbot.cfg
Lines changed: 1 addition & 1 deletion b/‎coderbot.cfg
Lines changed: 1 addition & 1 deletion
diff --git a/‎data/program_no_name.json
Lines changed: 1 addition & 0 deletions b/‎data/program_no_name.json
Lines changed: 1 addition & 0 deletions
diff --git a/‎data/program_test.json
Lines changed: 1 addition & 0 deletions b/‎data/program_test.json
Lines changed: 1 addition & 0 deletions
@@ -358,13 +358,16 @@ def cnn_classify(self, model_name=None, top_results=3):
         else:
             classifier = self._cnn_classifier_default
 
+        t0 = time.time()
         classes = None
         try:
             img = self.get_image()
             classes = classifier.classify_image(img.mat(), top_results=top_results)
         except Exception:
             logging.warning("classifier not available")
             classes = [("None", 1.0)]
+            raise
+        logging.info("fps: %f", 1.0/(time.time()-t0))
         return classes
 
     def find_class(self):
 
@@ -23,99 +23,129 @@
 import logging
 
 import numpy as np
-import tensorflow as tf
+from tensorflow.lite.python.interpreter import Interpreter
+import cv2
 
 logger = logging.getLogger(__name__)
 
 class CNNClassifier(object):
     def __init__(self, model_file, label_file, input_layer="input", output_layer="final_result", input_height=128, input_width=128, input_mean=127.5, input_std=127.5):
-        self._graph = self.load_graph(model_file)
+        logger.info(model_file)
+        self._interpreter = Interpreter(model_path=model_file)
+        self._interpreter.set_num_threads(4)
+        self._interpreter.allocate_tensors()
         self._labels = self.load_labels(label_file)
-        self.input_height=input_height
-        self.input_width=input_width
-        input_name = "import/" + input_layer
-        output_name = "import/" + output_layer
-        self._input_operation = self._graph.get_operation_by_name(input_name)
-        self._output_operation = self._graph.get_operation_by_name(output_name)
-        self._session = tf.Session(graph=self._graph)
-        self._graph_norm = tf.Graph()
-        with self._graph_norm.as_default():
-            image_mat = tf.placeholder(tf.float32, None, name="image_rgb_in")
-            float_caster = tf.cast(image_mat, tf.float32)
-            dims_expander = tf.expand_dims(float_caster, 0)
-            resized = tf.image.resize_bilinear(dims_expander, [input_height, input_width])
-            normalized = tf.divide(tf.subtract(resized, [input_mean]), [input_std], name="image_norm_out")
-            self._input_operation_norm = self._graph_norm.get_operation_by_name("image_rgb_in")
-            self._output_operation_norm = self._graph_norm.get_operation_by_name("image_norm_out")
-        self._sess_norm = tf.Session(graph=self._graph_norm)
+        self._input_details = self._interpreter.get_input_details()
+        self._output_details = self._interpreter.get_output_details()
+        self._input_height=self._input_details[0]['shape'][1]
+        self._input_width=self._input_details[0]['shape'][2]
+        self._floating_model = (self._input_details[0]['dtype'] == np.float32)
+        #input_name = "import/" + input_layer
+        #output_name = "import/" + output_layer
+        #self._input_operation = self._graph.get_operation_by_name(input_name)
+        #self._output_operation = self._graph.get_operation_by_name(output_name)
+        #self._session = tf.compat.v1.Session(graph=self._graph)
+        #self._graph_norm = tf.Graph()
+        #with self._graph_norm.as_default():
+        #    image_mat = tf.compat.v1.placeholder(tf.float32, None, name="image_rgb_in")
+        #    float_caster = tf.cast(image_mat, tf.float32)
+        #    dims_expander = tf.expand_dims(float_caster, 0)
+        #    resized = tf.compat.v1.image.resize_bilinear(dims_expander, [input_height, input_width])
+        #    normalized = tf.divide(tf.subtract(resized, [input_mean]), [input_std], name="image_norm_out")
+        #    self._input_operation_norm = self._graph_norm.get_operation_by_name("image_rgb_in")
+        #    self._output_operation_norm = self._graph_norm.get_operation_by_name("image_norm_out")
+        #self._sess_norm = tf.Session(graph=self._graph_norm)
 
     def close(self):
-        self._session.close()
-        self._sess_norm.close()
-
-    def load_graph(self, model_file):
-        graph = tf.Graph()
-        graph_def = tf.GraphDef()
-
-        with open(model_file, "rb") as f:
-            graph_def.ParseFromString(f.read())
-        with graph.as_default():
-            tf.import_graph_def(graph_def)
-
-        return graph
-
-    def read_tensor_from_image_file(self, file_name, input_height=299, input_width=299, input_mean=0, input_std=255):
-        input_name = "file_reader"
-        output_name = "normalized"
-
-        file_reader = tf.read_file(file_name, input_name)
-
-        if file_name.endswith(".png"):
-            image_reader = tf.image.decode_png(file_reader, channels=3, name='png_reader')
-        elif file_name.endswith(".gif"):
-            image_reader = tf.squeeze(tf.image.decode_gif(file_reader, name='gif_reader'))
-        elif file_name.endswith(".bmp"):
-            image_reader = tf.image.decode_bmp(file_reader, name='bmp_reader')
-        else:
-            image_reader = tf.image.decode_jpeg(file_reader, channels=3, name='jpeg_reader')
-
-        float_caster = tf.cast(image_reader, tf.float32)
-        dims_expander = tf.expand_dims(float_caster, 0);
-        resized = tf.image.resize_bilinear(dims_expander, [self.input_height, self.input_width])
-        normalized = tf.divide(tf.subtract(resized, [input_mean]), [input_std])
-        sess = tf.Session()
-
-        result = sess.run(normalized)
-        sess.close()
+        pass
+        #self._session.close()
+        #self._sess_norm.close()
+
+    #def load_graph(self, model_file):
+    #   graph = tf.Graph()
+    #    graph_def = tf.compat.v1.GraphDef()
+    #
+    #    with open(model_file, "rb") as f:
+    #        graph_def.ParseFromString(f.read())
+    #    with graph.as_default():
+    #        tf.import_graph_def(graph_def)
+    #
+    #    return graph
+    #
+    #def read_tensor_from_image_file(self, file_name, input_height=299, input_width=299, input_mean=0, input_std=255):
+    #    input_name = "file_reader"
+    #    output_name = "normalized"
+    #
+    #    file_reader = tf.read_file(file_name, input_name)
+    #
+    #    if file_name.endswith(".png"):
+    #        image_reader = tf.image.decode_png(file_reader, channels=3, name='png_reader')
+    #    elif file_name.endswith(".gif"):
+    #        image_reader = tf.squeeze(tf.image.decode_gif(file_reader, name='gif_reader'))
+    #    elif file_name.endswith(".bmp"):
+    #        image_reader = tf.image.decode_bmp(file_reader, name='bmp_reader')
+    #    else:
+    #        image_reader = tf.image.decode_jpeg(file_reader, channels=3, name='jpeg_reader')
+    #
+    #    float_caster = tf.cast(image_reader, tf.float32)
+    #    dims_expander = tf.expand_dims(float_caster, 0);
+    #    resized = tf.image.resize_bilinear(dims_expander, [self.input_height, self.input_width])
+    #    normalized = tf.divide(tf.subtract(resized, [input_mean]), [input_std])
+    #    sess = tf.Session()
+    #
+    #    result = sess.run(normalized)
+    #    sess.close()
+    #
+    #    return result
+    #
+    #def read_tensor_from_image_mat(self, image_mat, input_height=299, input_width=299, input_mean=0, input_std=255):
+    #    result = self._sess_norm.run(self._output_operation_norm.outputs[0], {self._input_operation_norm.outputs[0]: image_mat})
+    #    return result
+    def read_tensor_from_image_mat(self, image_mat, input_height=299, input_width=299, input_mean=0, input_std=255):
+        frame_rgb = cv2.cvtColor(image_mat, cv2.COLOR_BGR2RGB)
+        frame_resized = cv2.resize(frame_rgb, (self._input_width, self._input_height))
+        input_data = np.expand_dims(frame_resized, axis=0)
 
-        return result
+            # Normalize pixel values if using a floating model (i.e. if model is non-quantized)
+        if self._floating_model:
+            input_mean = 127.5
+            input_std = 127.5
+            input_data = (np.float32(input_data) - input_mean) / input_std
 
-    def read_tensor_from_image_mat(self, image_mat, input_height=299, input_width=299, input_mean=0, input_std=255):
-        result = self._sess_norm.run(self._output_operation_norm.outputs[0], {self._input_operation_norm.outputs[0]: image_mat})
-        return result
+        return input_data
 
     def load_labels(self, label_file):
-        label = []
-        proto_as_ascii_lines = tf.gfile.GFile(label_file).readlines()
-        for l in proto_as_ascii_lines:
-            label.append(l.rstrip())
-        return label
+        labels = []
+        with open(label_file, 'r') as f:
+            labels = [line.strip() for line in f.readlines()]
+        return labels
 
     def classify_image(self,
                        image_file_or_mat,
                        top_results=3):
-        t = None
-        if isinstance(image_file_or_mat, str):
-            t = self.read_tensor_from_image_file(file_name=image_file_or_mat)
-        else:
-            t = self.read_tensor_from_image_mat(image_file_or_mat)
-
-        results = self._session.run(self._output_operation.outputs[0],
-                                    {self._input_operation.outputs[0]: t})
-
-        top_results = min(top_results, len(self._labels))
-        results = np.squeeze(results)
-        results_idx = np.argpartition(results, -top_results)[-top_results:]
-        results_idx = np.flip(results_idx[np.argsort(results[results_idx])], axis=0)
-        pairs = [(self._labels[i], results[i]) for i in results_idx]
+        input_image = None
+        #if isinstance(image_file_or_mat, str):
+        #    t = self.read_tensor_from_image_file(file_name=image_file_or_mat)
+        #else:
+        input_image = self.read_tensor_from_image_mat(image_file_or_mat)
+
+        logger.info("classify.0")
+        self._interpreter.set_tensor(self._input_details[0]['index'], input_image)
+        self._interpreter.invoke()
+        logger.info("classify.1")
+        scores = self._interpreter.get_tensor(self._output_details[0]['index'])[0] # Bounding box coordinates of detected objects
+        #logger.info("classify.2")
+        #classes = self._interpreter.get_tensor(self._output_details[1]['index'])[0] # Class index of detected objects
+        #logger.info("classify.3")
+        #scores = self._interpreter.get_tensor(self._output_details[2]['index'])[0] # Confidence of detected objects
+        #logger.info("classify.4")
+
+        #pairs = [(classes[i], scores[i], boxes[i]) for i in range(0, len(classes))]
+        pairs = []
+        for i in range(0, len(scores)):
+            if scores[i] > 0.5:
+                object_name = self._labels[i]
+                pairs.append((object_name, scores[i]))
+
+        logger.info(str(pairs))
         return pairs
@@ -71,7 +71,7 @@ def _save_model_meta(self):
     def delete_model(self, model_name):
         if self._models.get(model_name):
             try:
-                os.remove(MODEL_PATH + "/" + model_name + ".pb")
+                os.remove(MODEL_PATH + "/" + model_name + ".tflite")
                 os.remove(MODEL_PATH + "/" + model_name + ".txt")
             except Exception:
                 logging.warning("model files not found: %s", model_name)
@@ -103,7 +103,7 @@ def wait_train_jobs(self):
     def load_model(self, model_name):
         model_info = self._models.get(model_name)
         if model_info:
-            return CNNClassifier(model_file=MODEL_PATH + "/" + model_name + ".pb",
+            return CNNClassifier(model_file=MODEL_PATH + "/" + model_name + ".tflite",
                                  label_file=MODEL_PATH + "/" + model_name + ".txt",
                                  output_layer=model_info["output_layer"],
                                  input_height=int(model_info["image_height"]),
 
@@ -1 +1 @@
-{}
+{"mobilenet_v1_1_0_quant": {"status": 100, "image_height": 120, "image_width": 160, "output_layer":"final_result"}}
@@ -1 +1 @@
-{"move_power_angle_3": "60", "cnn_default_model": "generic_fast_low", "prog_maxblocks": "-1", "camera_jpeg_quality": "5", "show_page_control": "true", "camera_framerate": "30", "prog_scrollbars": "true", "move_fw_speed": "100", "prog_level": "adv", "move_motor_trim": "1", "move_motor_mode": "dc", "cv_image_factor": "2", "move_power_angle_1": "45", "camera_path_object_size_min": "4000", "button_func": "none", "camera_color_object_size_min": "4000", "camera_jpeg_bitrate": "1000000", "move_fw_elapse": "1", "show_control_move_commands": "true", "camera_color_object_size_max": "160000", "show_page_prefs": "true", "camera_exposure_mode": "auto", "ctrl_tr_elapse": "-1", "show_page_program": "true", "move_tr_elapse": "0.5", "camera_path_object_size_max": "160000", "sound_shutter": "$shutter.mp3", "ctrl_fw_elapse": "-1", "sound_stop": "$shutdown.mp3", "ctrl_tr_speed": "80", "ctrl_fw_speed": "100", "move_tr_speed": "85", "move_power_angle_2": "60", "ctrl_hud_image": "", "load_at_start": "", "sound_start": "$startup.mp3"}
+{"cv_image_factor": "2", "camera_jpeg_quality": "5", "button_func": "none", "move_power_angle_2": "60", "show_control_move_commands": "true", "move_tr_elapse": "0.5", "cnn_default_model": "test_model_2", "prog_level": "adv", "sound_stop": "$shutdown.mp3", "show_page_prefs": "true", "prog_scrollbars": "true", "camera_framerate": "30", "camera_color_object_size_min": "4000", "camera_path_object_size_max": "160000", "move_power_angle_1": "45", "camera_jpeg_bitrate": "1000000", "ctrl_fw_elapse": "-1", "move_fw_speed": "100", "load_at_start": "", "move_fw_elapse": "1", "camera_path_object_size_min": "4000", "move_power_angle_3": "60", "move_motor_trim": "1", "ctrl_tr_elapse": "-1", "ctrl_hud_image": "", "show_page_program": "true", "sound_shutter": "$shutter.mp3", "move_motor_mode": "dc", "ctrl_tr_speed": "80", "show_page_control": "true", "ctrl_fw_speed": "100", "sound_start": "$startup.mp3", "move_tr_speed": "85", "prog_maxblocks": "-1", "camera_exposure_mode": "auto", "camera_color_object_size_max": "160000"}
@@ -0,0 +1 @@
+{"default": false, "dom_code": "<xml xmlns=\"http://www.w3.org/1999/xhtml\"><variables></variables><block type=\"controls_whileUntil\" id=\"xXU^DJr+Fh^n4M,eREVS\" x=\"9\" y=\"103\"><field name=\"MODE\">WHILE</field><value name=\"BOOL\"><block type=\"logic_boolean\" id=\"2#CR3x-DiNn15XRtq`$D\"><field name=\"BOOL\">TRUE</field></block></value><statement name=\"DO\"><block type=\"text_print\" id=\"eanFh@r$ewRF;YZ#O9rJ\"><value name=\"TEXT\"><block type=\"coderbot_adv_cnn_classify\" id=\"?lUUHe~fRFjS%S9mLB8v\"><field name=\"MODEL\">mobilenet_v1_1_0_quant</field></block></value></block></statement></block></xml>", "name": "no_name", "code": "while True:\n  get_prog_eng().check_end()\n  get_cam().set_text(get_cam().cnn_classify(\"mobilenet_v1_1_0_quant\"))\n"}
@@ -0,0 +1 @@
+{"default": false, "dom_code": "<xml xmlns=\"http://www.w3.org/1999/xhtml\"><variables></variables><block type=\"controls_whileUntil\" id=\"xXU^DJr+Fh^n4M,eREVS\" x=\"9\" y=\"103\"><field name=\"MODE\">WHILE</field><value name=\"BOOL\"><block type=\"logic_boolean\" id=\"2#CR3x-DiNn15XRtq`$D\"><field name=\"BOOL\">TRUE</field></block></value><statement name=\"DO\"><block type=\"text_print\" id=\"eanFh@r$ewRF;YZ#O9rJ\"><value name=\"TEXT\"><block type=\"coderbot_adv_cnn_classify\" id=\"?lUUHe~fRFjS%S9mLB8v\"><field name=\"MODEL\">mobilenet_v1_1_0_quant</field></block></value></block></statement></block></xml>", "name": "test", "code": "while True:\n  get_prog_eng().check_end()\n  get_cam().set_text(get_cam().cnn_classify(\"mobilenet_v1_1_0_quant\"))\n"}
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-{}`
	`1`	`+{"mobilenet_v1_1_0_quant": {"status": 100, "image_height": 120, "image_width": 160, "output_layer":"final_result"}}`
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		-{"move_power_angle_3": "60", "cnn_default_model": "generic_fast_low", "prog_maxblocks": "-1", "camera_jpeg_quality": "5", "show_page_control": "true", "camera_framerate": "30", "prog_scrollbars": "true", "move_fw_speed": "100", "prog_level": "adv", "move_motor_trim": "1", "move_motor_mode": "dc", "cv_image_factor": "2", "move_power_angle_1": "45", "camera_path_object_size_min": "4000", "button_func": "none", "camera_color_object_size_min": "4000", "camera_jpeg_bitrate": "1000000", "move_fw_elapse": "1", "show_control_move_commands": "true", "camera_color_object_size_max": "160000", "show_page_prefs": "true", "camera_exposure_mode": "auto", "ctrl_tr_elapse": "-1", "show_page_program": "true", "move_tr_elapse": "0.5", "camera_path_object_size_max": "160000", "sound_shutter": "$shutter.mp3", "ctrl_fw_elapse": "-1", "sound_stop": "$shutdown.mp3", "ctrl_tr_speed": "80", "ctrl_fw_speed": "100", "move_tr_speed": "85", "move_power_angle_2": "60", "ctrl_hud_image": "", "load_at_start": "", "sound_start": "$startup.mp3"}
	`1`	+{"cv_image_factor": "2", "camera_jpeg_quality": "5", "button_func": "none", "move_power_angle_2": "60", "show_control_move_commands": "true", "move_tr_elapse": "0.5", "cnn_default_model": "test_model_2", "prog_level": "adv", "sound_stop": "$shutdown.mp3", "show_page_prefs": "true", "prog_scrollbars": "true", "camera_framerate": "30", "camera_color_object_size_min": "4000", "camera_path_object_size_max": "160000", "move_power_angle_1": "45", "camera_jpeg_bitrate": "1000000", "ctrl_fw_elapse": "-1", "move_fw_speed": "100", "load_at_start": "", "move_fw_elapse": "1", "camera_path_object_size_min": "4000", "move_power_angle_3": "60", "move_motor_trim": "1", "ctrl_tr_elapse": "-1", "ctrl_hud_image": "", "show_page_program": "true", "sound_shutter": "$shutter.mp3", "move_motor_mode": "dc", "ctrl_tr_speed": "80", "show_page_control": "true", "ctrl_fw_speed": "100", "sound_start": "$startup.mp3", "move_tr_speed": "85", "prog_maxblocks": "-1", "camera_exposure_mode": "auto", "camera_color_object_size_max": "160000"}
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	+{"default": false, "dom_code": "<xml xmlns=\"http://www.w3.org/1999/xhtml\"><variables></variables><block type=\"controls_whileUntil\" id=\"xXU^DJr+Fh^n4M,eREVS\" x=\"9\" y=\"103\"><field name=\"MODE\">WHILE</field><value name=\"BOOL\"><block type=\"logic_boolean\" id=\"2#CR3x-DiNn15XRtq`$D\"><field name=\"BOOL\">TRUE</field></block></value><statement name=\"DO\"><block type=\"text_print\" id=\"eanFh@r$ewRF;YZ#O9rJ\"><value name=\"TEXT\"><block type=\"coderbot_adv_cnn_classify\" id=\"?lUUHe~fRFjS%S9mLB8v\"><field name=\"MODEL\">mobilenet_v1_1_0_quant</field></block></value></block></statement></block></xml>", "name": "no_name", "code": "while True:\n get_prog_eng().check_end()\n get_cam().set_text(get_cam().cnn_classify(\"mobilenet_v1_1_0_quant\"))\n"}