Adding gradient clipping for detection models.

tensorflower-gardener · aman2930 · commit 912b54b66472 · 2021-04-05T14:16:10.000-07:00
PiperOrigin-RevId: 365639389
diff --git a/official/vision/detection/configs/shapemask_config.py b/official/vision/detection/configs/shapemask_config.py
@@ -17,7 +17,7 @@
 from official.modeling.hyperparams import params_dict
 from official.vision.detection.configs import base_config
 
-SHAPEMASK_RESNET_FROZEN_VAR_PREFIX = r'(resnet\d+/)conv2d(|_([1-9]|10))\/'
+SHAPEMASK_RESNET_FROZEN_VAR_PREFIX = r'(conv2d(|_([1-9]|10))|batch_normalization(|_([1-9]|10)))\/'
 
 SHAPEMASK_CFG = params_dict.ParamsDict(base_config.BASE_CFG)
 SHAPEMASK_CFG.override({
diff --git a/official/vision/detection/executor/detection_executor.py b/official/vision/detection/executor/detection_executor.py
@@ -63,10 +63,9 @@ def _create_replicated_step(self,
           trainable_variables)
     logging.info('Filter trainable variables from %d to %d',
                  len(model.trainable_variables), len(trainable_variables))
-    _update_state = lambda labels, outputs: None
+    update_state_fn = lambda labels, outputs: None
     if isinstance(metric, tf.keras.metrics.Metric):
-      _update_state = lambda labels, outputs: metric.update_state(
-          labels, outputs)
+      update_state_fn = metric.update_state
     else:
       logging.error('Detection: train metric is not an instance of '
                     'tf.keras.metrics.Metric.')
@@ -82,10 +81,11 @@ def _replicated_step(inputs):
         for k, v in all_losses.items():
           losses[k] = tf.reduce_mean(v)
         per_replica_loss = losses['total_loss'] / strategy.num_replicas_in_sync
-        _update_state(labels, outputs)
+        update_state_fn(labels, outputs)
 
       grads = tape.gradient(per_replica_loss, trainable_variables)
-      optimizer.apply_gradients(zip(grads, trainable_variables))
+      clipped_grads, _ = tf.clip_by_global_norm(grads, clip_norm=1.0)
+      optimizer.apply_gradients(zip(clipped_grads, trainable_variables))
       return losses
 
     return _replicated_step