fix a few things

xadupre · xadupre · commit 581cbb5ef180 · 2025-10-02T18:17:16.000+02:00
diff --git a/CHANGELOGS.rst b/CHANGELOGS.rst
@@ -4,7 +4,7 @@ Change Logs
 0.7.13
 ++++++
 
-* :pr:`237`: dummy inputs for gemma-3-4b-it
+* :pr:`237`: dummy inputs for google/gemma-3-4b-it
 * :pr:`244`: add a patch to bypass the exception raised when the dynamic dimension is in {0,1}
 
 0.7.12
diff --git a/onnx_diagnostic/tasks/image_text_to_text.py b/onnx_diagnostic/tasks/image_text_to_text.py
@@ -144,7 +144,7 @@ def _get_inputs_gemma3(
             "sliding_attention": {0: batch, 2: seq_length, 3: tot_length},
         },
         "position_ids": {0: batch, 1: seq_length},
-        "cache_position": {1: seq_length},
+        "cache_position": {0: seq_length},
         "past_key_values": [
             [{0: batch} for _ in range(num_hidden_layers)],
             [{0: batch} for _ in range(num_hidden_layers)],
@@ -159,31 +159,37 @@ def _get_inputs_gemma3(
     dummies = dummies[("", 0, "I")][1]
     dummies = {k: v for k, v in dummies.items() if k in shapes}
     expected = {"input_ids", "token_type_ids", "position_ids", "cache_position"}
-    assert expected & set(
-        dummies
-    ), f"Unable to find expected inputs {expected} in loaded inputs {set(dummies)}"
-    assert sequence_length == dummies["input_ids"].shape[-1], (
-        f"sequence_length={sequence_length} != {dummies['input_ids'].shape[-1]} for "
-        f"model class {model.__class__.__name__}"
-    )
-    assert batch_size == dummies["input_ids"].shape[0], (
-        f"batch_size={batch_size} != {dummies['input_ids'].shape[0]} for "
-        f"model class {model.__class__.__name__}"
-    )
-    assert max_sequence_length == 580, (
-        f"max_sequence_length={max_sequence_length} != 580 "
-        f"for model {model.__class__.__name__}"
-    )
-    assert total_sequence_length == 860, (
-        f"total_sequence_length={total_sequence_length} != 860 "
-        f"for model {model.__class__.__name__}"
-    )
-    assert head_dim == 256, f"head_dim={head_dim} != 256 for model {model.__class__.__name__}"
-    assert n_images == 1, f"n_images={n_images} != 1 for model {model.__class__.__name__}"
-    assert num_key_value_heads == 4, (
-        f"num_key_value_heads={num_key_value_heads} != 256 "
-        f"for this model {model.__class__.__name__}"
-    )
+
+    def _check_():
+        assert expected & set(
+            dummies
+        ), f"Unable to find expected inputs {expected} in loaded inputs {set(dummies)}"
+        assert sequence_length == dummies["input_ids"].shape[-1], (
+            f"sequence_length={sequence_length} != {dummies['input_ids'].shape[-1]} for "
+            f"model class {model.__class__.__name__}"
+        )
+        assert batch_size == dummies["input_ids"].shape[0], (
+            f"batch_size={batch_size} != {dummies['input_ids'].shape[0]} for "
+            f"model class {model.__class__.__name__}"
+        )
+        assert max_sequence_length == 580, (
+            f"max_sequence_length={max_sequence_length} != 580 "
+            f"for model {model.__class__.__name__}"
+        )
+        assert total_sequence_length == 860, (
+            f"total_sequence_length={total_sequence_length} != 860 "
+            f"for model {model.__class__.__name__}"
+        )
+        assert (
+            head_dim == 256
+        ), f"head_dim={head_dim} != 256 for model {model.__class__.__name__}"
+        assert n_images == 1, f"n_images={n_images} != 1 for model {model.__class__.__name__}"
+        assert num_key_value_heads == 4, (
+            f"num_key_value_heads={num_key_value_heads} != 256 "
+            f"for this model {model.__class__.__name__}"
+        )
+
+    _check_()
 
     inputs = dict(
         input_ids=dummies["input_ids"],
diff --git a/onnx_diagnostic/torch_models/validate.py b/onnx_diagnostic/torch_models/validate.py
@@ -823,7 +823,7 @@ def validate_model(
             for key in ["model", "onnx_program", "config"]:
                 if key in data:
                     del data[key]
-            if "cuda" in device.lower():
+            if device is not None and "cuda" in str(device).lower():
                 torch.cuda.empty_cache()
             gc.collect()
             print("[validation_model] -- done")