Enable tracking annotator with box prompts

constantinpape · constantinpape · commit aa414a867c09 · 2023-05-19T17:16:24.000+02:00
diff --git a/micro_sam/sam_annotator/annotator_tracking.py b/micro_sam/sam_annotator/annotator_tracking.py
@@ -11,15 +11,17 @@
 # from vigra.filters import eccentricityCenters
 
 from .. import util
-from ..segment_from_prompts import segment_from_mask, segment_from_points
+from ..segment_from_prompts import segment_from_mask
 from .util import (
-    create_prompt_menu, prompt_layer_to_points, prompt_layer_to_state,
+    create_prompt_menu, clear_all_prompts,
+    prompt_layer_to_boxes, prompt_layer_to_points,
+    prompt_layer_to_state, prompt_segmentation,
     segment_slices_with_prompts, toggle_label, LABEL_COLOR_CYCLE
 )
 from ..visualization import project_embeddings_for_visualization
 
-# Magenta and Cyan
-STATE_COLOR_CYCLE = ["#FF00FF", "#00FFFF"]
+# Cyan (track) and Magenta (division)
+STATE_COLOR_CYCLE = ["#00FFFF", "#FF00FF", ]
 
 
 #
@@ -56,7 +58,7 @@ def _shift_object(mask, motion_model):
 
 # TODO division classifier
 def _track_from_prompts(
-    prompt_layer, seg, predictor, slices, image_embeddings,
+    point_prompts, box_prompts, seg, predictor, slices, image_embeddings,
     stop_upper, threshold, projection,
     progress_bar=None, motion_smoothing=0.5,
 ):
@@ -99,7 +101,9 @@ def _update_motion_model(seg, t, t0, motion_model):
         if t in slices:
             seg_prev = None
             seg_t = seg[t]
-            track_state = prompt_layer_to_state(prompt_layer, t)
+            # currently using the box layer doesn't work for keeping track of the track state
+            # track_state = prompt_layers_to_state(point_prompts, box_prompts, t)
+            track_state = prompt_layer_to_state(point_prompts, t)
 
         # otherwise project the mask (under the motion model) and segment the next slice from the mask
         else:
@@ -180,9 +184,24 @@ def segment_frame_wigdet(v: Viewer):
     position = v.cursor.position
     t = int(position[0])
 
-    this_prompts = prompt_layer_to_points(v.layers["prompts"], t, track_id=CURRENT_TRACK_ID)
-    points, labels = this_prompts
-    seg = segment_from_points(PREDICTOR, points, labels, image_embeddings=IMAGE_EMBEDDINGS, i=t)
+    point_prompts = prompt_layer_to_points(v.layers["prompts"], t, track_id=CURRENT_TRACK_ID)
+    # this is a stop prompt, we do nothing
+    if not point_prompts:
+        return
+
+    boxes = prompt_layer_to_boxes(v.layers["box_prompts"], t, track_id=CURRENT_TRACK_ID)
+    points, labels = point_prompts
+
+    shape = v.layers["current_track"].data.shape[1:]
+    seg = prompt_segmentation(
+        PREDICTOR, points, labels, boxes, shape, multiple_box_prompts=False,
+        image_embeddings=IMAGE_EMBEDDINGS, i=t
+    )
+
+    # no prompts were given or prompts were invalid, skip segmentation
+    if seg is None:
+        print("You either haven't provided any prompts or invalid prompts. The segmentation will be skipped.")
+        return
 
     # clear the old segmentation for this track_id
     old_mask = v.layers["current_track"].data[t] == CURRENT_TRACK_ID
@@ -209,14 +228,16 @@ def track_objet_widget(
     with progress(total=shape[0]) as progress_bar:
         # step 1: segment all slices with prompts
         seg, slices, _, stop_upper = segment_slices_with_prompts(
-            PREDICTOR, v.layers["prompts"], IMAGE_EMBEDDINGS, shape,
+            PREDICTOR, v.layers["prompts"], v.layers["box_prompts"], IMAGE_EMBEDDINGS, shape,
             progress_bar=progress_bar, track_id=CURRENT_TRACK_ID
         )
 
         # step 2: track the object starting from the lowest annotated slice
         seg, has_division = _track_from_prompts(
-            v.layers["prompts"], seg, PREDICTOR, slices, IMAGE_EMBEDDINGS, stop_upper, threshold=iou_threshold,
-            projection=projection_, progress_bar=progress_bar, motion_smoothing=motion_smoothing,
+            v.layers["prompts"], v.layers["box_prompts"], seg,
+            PREDICTOR, slices, IMAGE_EMBEDDINGS, stop_upper,
+            threshold=iou_threshold, projection=projection_,
+            progress_bar=progress_bar, motion_smoothing=motion_smoothing,
         )
 
     # if a division has occurred and it's the first time it occurred for this track
@@ -231,7 +252,7 @@ def track_objet_widget(
     v.layers["current_track"].refresh()
 
 
-def create_tracking_menu(points_layer, states, track_ids):
+def create_tracking_menu(points_layer, box_layer, states, track_ids):
     state_menu = ComboBox(label="track_state", choices=states)
     track_id_menu = ComboBox(label="track_id", choices=list(map(str, track_ids)))
     tracking_widget = Container(widgets=[state_menu, track_id_menu])
@@ -245,11 +266,25 @@ def update_track_id(event):
         global CURRENT_TRACK_ID
         new_id = str(points_layer.current_properties["track_id"][0])
         if new_id != track_id_menu.value:
-            state_menu.value = new_id
+            track_id_menu.value = new_id
+            CURRENT_TRACK_ID = int(new_id)
+
+    # def update_state_boxes(event):
+    #     new_state = str(box_layer.current_properties["state"][0])
+    #     if new_state != state_menu.value:
+    #         state_menu.value = new_state
+
+    def update_track_id_boxes(event):
+        global CURRENT_TRACK_ID
+        new_id = str(box_layer.current_properties["track_id"][0])
+        if new_id != track_id_menu.value:
+            track_id_menu.value = new_id
             CURRENT_TRACK_ID = int(new_id)
 
     points_layer.events.current_properties.connect(update_state)
     points_layer.events.current_properties.connect(update_track_id)
+    # box_layer.events.current_properties.connect(update_state_boxes)
+    box_layer.events.current_properties.connect(update_track_id_boxes)
 
     def state_changed(new_state):
         current_properties = points_layer.current_properties
@@ -264,8 +299,23 @@ def track_id_changed(new_track_id):
         points_layer.current_properties = current_properties
         CURRENT_TRACK_ID = int(new_track_id)
 
+    # def state_changed_boxes(new_state):
+    #     current_properties = box_layer.current_properties
+    #     current_properties["state"] = np.array([new_state])
+    #     box_layer.current_properties = current_properties
+    #     box_layer.refresh_colors()
+
+    def track_id_changed_boxes(new_track_id):
+        global CURRENT_TRACK_ID
+        current_properties = box_layer.current_properties
+        current_properties["track_id"] = np.array([new_track_id])
+        box_layer.current_properties = current_properties
+        CURRENT_TRACK_ID = int(new_track_id)
+
     state_menu.changed.connect(state_changed)
     track_id_menu.changed.connect(track_id_changed)
+    # state_menu.changed.connect(state_changed_boxes)
+    track_id_menu.changed.connect(track_id_changed_boxes)
 
     state_menu.set_choice("track")
     return tracking_widget
@@ -295,8 +345,7 @@ def commit_tracking_widget(v: Viewer, layer: str = "current_track"):
     v.layers[layer].data = np.zeros(shape, dtype="uint32")
     v.layers[layer].refresh()
 
-    v.layers["prompts"].data = []
-    v.layers["prompts"].refresh()
+    clear_all_prompts(v)
 
 
 def annotator_tracking(raw, embedding_path=None, show_embeddings=False, tracking_result=None, model_type="vit_h"):
@@ -333,7 +382,7 @@ def annotator_tracking(raw, embedding_path=None, show_embeddings=False, tracking
     # add the widgets
     #
     labels = ["positive", "negative"]
-    state_labels = ["division", "track"]
+    state_labels = ["track", "division"]
     prompts = v.add_points(
         data=[[0.0, 0.0, 0.0], [0.0, 0.0, 0.0]],  # FIXME workaround
         name="prompts",
@@ -354,6 +403,24 @@ def annotator_tracking(raw, embedding_path=None, show_embeddings=False, tracking
     prompts.edge_color_mode = "cycle"
     prompts.face_color_mode = "cycle"
 
+    # using the box layer to set divisions currently doesn't work
+    # (and setting new track ids also doesn't work, but keeping track of them in the properties is working)
+    box_prompts = v.add_shapes(
+        data=[
+            np.array([[0, 0, 0], [0, 0, 10], [0, 10, 0], [0, 10, 10]]),
+            np.array([[0, 0, 0], [0, 0, 11], [0, 11, 0], [0, 11, 11]]),
+        ],  # FIXME workaround
+        shape_type="rectangle",  # FIXME workaround
+        edge_width=4, ndim=3,
+        face_color="transparent",
+        name="box_prompts",
+        edge_color="green",
+        properties={"track_id": ["1", "1"]},
+        # properties={"track_id": ["1", "1"], "state": state_labels},
+        # edge_color_cycle=STATE_COLOR_CYCLE,
+    )
+    # box_prompts.edge_color_mode = "cycle"
+
     #
     # add the widgets
     #
@@ -363,7 +430,7 @@ def annotator_tracking(raw, embedding_path=None, show_embeddings=False, tracking
     prompt_widget = create_prompt_menu(prompts, labels)
     v.window.add_dock_widget(prompt_widget)
 
-    TRACKING_WIDGET = create_tracking_menu(prompts, state_labels, list(LINEAGE.keys()))
+    TRACKING_WIDGET = create_tracking_menu(prompts, box_prompts, state_labels, list(LINEAGE.keys()))
     v.window.add_dock_widget(TRACKING_WIDGET)
 
     v.window.add_dock_widget(segment_frame_wigdet)
@@ -392,8 +459,7 @@ def _commit(v):
 
     @v.bind_key("Shift-C")
     def clear_prompts(v):
-        prompts.data = []
-        prompts.refresh()
+        clear_all_prompts(v)
 
     #
     # start the viewer
diff --git a/micro_sam/sam_annotator/util.py b/micro_sam/sam_annotator/util.py
@@ -121,18 +121,19 @@ def prompt_layer_to_boxes(prompt_layer, i=None, track_id=None):
         if any(non_rectangle):
             print(f"You have provided {sum(non_rectangle)} shapes that are not rectangles.")
             print("We currently do not support these as prompts and they will be ignored.")
-        boxes = [
-            data[:, 1:] for data, stype in zip(shape_data, shape_types)
-            if (stype == "rectangle" and (data[:, 0] == i).all())
-        ]
-
-    # TODO support for track_id
-    # if track_id is not None:
-    #     assert i is not None
-    #     track_ids = np.array(list(map(int, prompt_layer.properties["track_id"])))[mask]
-    #     track_id_mask = track_ids == track_id
-    #     this_labels, this_points = this_labels[track_id_mask], this_points[track_id_mask]
-    # assert len(this_points) == len(this_labels)
+
+        if track_id is None:
+            boxes = [
+                data[:, 1:] for data, stype in zip(shape_data, shape_types)
+                if (stype == "rectangle" and (data[:, 0] == i).all())
+            ]
+        else:
+            track_ids = np.array(list(map(int, prompt_layer.properties["track_id"])))
+            assert len(track_ids) == len(shape_data)
+            boxes = [
+                data[:, 1:] for data, stype, this_track_id in zip(shape_data, shape_types, track_ids)
+                if (stype == "rectangle" and (data[:, 0] == i).all() and this_track_id == track_id)
+            ]
 
     # map to correct box format
     boxes = [
@@ -147,7 +148,7 @@ def prompt_layer_to_state(prompt_layer, i):
 
     Arguments:
         prompt_layer: the point layer
-        i [int] - index for the data (required for 3d data)
+        i [int] - frame of the data
     """
     state = prompt_layer.properties["state"]
 
@@ -165,6 +166,39 @@ def prompt_layer_to_state(prompt_layer, i):
         return "track"
 
 
+def prompt_layers_to_state(point_layer, box_layer, i):
+    """Get the state of the track from the point and box prompt layer.
+    Only relevant for annotator_tracking.
+
+    Arguments:
+        point_layer: the point layer
+        box_layer: the box layer
+        i [int] - frame of the data
+    """
+    state = point_layer.properties["state"]
+
+    points = point_layer.data
+    assert points.shape[1] == 3, f"{points.shape}"
+    mask = points[:, 0] == i
+    if mask.sum() > 0:
+        this_state = state[mask].tolist()
+    else:
+        this_state = []
+
+    box_states = box_layer.properties["state"]
+    this_box_states = [
+        state for box, state in zip(box_layer.data, box_states)
+        if (box[:, 0] == i).all()
+    ]
+    this_state.extend(this_box_states)
+
+    # we set the state to 'division' if at least one point in this frame has a division label
+    if any(st == "division" for st in this_state):
+        return "division"
+    else:
+        return "track"
+
+
 def segment_slices_with_prompts(
     predictor, point_prompts, box_prompts, image_embeddings, shape, progress_bar=None, track_id=None
 ):
@@ -175,13 +209,17 @@ def segment_slices_with_prompts(
     seg = np.zeros(shape, dtype="uint32")
 
     z_values = point_prompts.data[:, 0]
-    z_values_boxes = np.concatenate([box[:, 0] for box in box_prompts.data])
+    z_values_boxes = np.concatenate([box[:1, 0] for box in box_prompts.data]) if box_prompts.data else\
+        np.zeros(0, dtype="int")
 
-    # TODO add track id properties to boxes as well, filter z_values_boxes accordingly
     if track_id is not None:
-        track_ids = np.array(list(map(int, point_prompts.properties["track_id"])))
-        assert len(track_ids) == len(z_values)
-        z_values = z_values[track_ids == track_id]
+        track_ids_points = np.array(list(map(int, point_prompts.properties["track_id"])))
+        assert len(track_ids_points) == len(z_values)
+        z_values = z_values[track_ids_points == track_id]
+
+        track_ids_boxes = np.array(list(map(int, box_prompts.properties["track_id"])))
+        assert len(track_ids_boxes) == len(z_values_boxes), f"{len(track_ids_boxes)}, {len(z_values_boxes)}"
+        z_values_boxes = z_values_boxes[track_ids_boxes == track_id]
 
     slices = np.unique(np.concatenate([z_values, z_values_boxes])).astype("int")
     stop_lower, stop_upper = False, False