refactor

xadupre · xadupre · commit f1c6529b9cda · 2025-03-27T20:02:26.000+01:00
diff --git a/_unittests/ut_torch_models/test_hghub_model.py b/_unittests/ut_torch_models/test_hghub_model.py
@@ -1,3 +1,4 @@
+import pprint
 import unittest
 import transformers
 from onnx_diagnostic.ext_test_case import (
@@ -11,6 +12,7 @@
     config_class_from_architecture,
     get_untrained_model_with_inputs,
 )
+from onnx_diagnostic.torch_models.hghub.hub_api import get_pretrained_config
 from onnx_diagnostic.torch_models.hghub.hub_data import load_models_testing
 
 
@@ -73,12 +75,30 @@ def test_get_untrained_model_with_inputs_beit(self):
     @hide_stdout()
     @long_test()
     def test_get_untrained_model_Ltesting_models(self):
+        def _diff(c1, c2):
+            rows = [f"types {c1.__class__.__name__} <> {c2.__class__.__name__}"]
+            for k, v in c1.__dict__.items():
+                if isinstance(v, (str, dict, list, tuple, int, float)) and v != getattr(
+                    c2, k, None
+                ):
+                    rows.append(f"{k} :: -- {v} ++ {getattr(c2, k, "MISS")}")
+            return "\n".join(rows)
+
         # UNHIDE=1 LONGTEST=1 python _unittests/ut_torch_models/test_hghub_model.py -k L -f
         for mid in load_models_testing():
             with self.subTest(mid=mid):
                 data = get_untrained_model_with_inputs(mid, verbose=1)
                 model, inputs = data["model"], data["inputs"]
-                model(**inputs)
+                try:
+                    model(**inputs)
+                except Exception as e:
+                    diff = _diff(get_pretrained_config(mid), data["configuration"])
+                    raise AssertionError(
+                        f"Computation failed due to {e}.\n--- pretrained\n"
+                        f"{pprint.pformat(get_pretrained_config(mid))}\n"
+                        f"--- modified\n{data['configuration']}\n"
+                        f"--- diff\n{diff}"
+                    ) from e
                 # different expected value for different version of transformers
                 if data["size"] > 2**30:
                     raise AssertionError(
diff --git a/onnx_diagnostic/torch_models/hghub/model_inputs.py b/onnx_diagnostic/torch_models/hghub/model_inputs.py
@@ -102,31 +102,21 @@ def get_untrained_model_with_inputs(
     arch = archs[0]
     if verbose:
         print(f"[get_untrained_model_with_inputs] architecture={arch!r}")
-    cls = config_class_from_architecture(arch, exc=False)
-    if cls is None:
-        if verbose:
-            print(
-                "[get_untrained_model_with_inputs] no found config name in the code, loads it"
-            )
-        config = get_pretrained_config(model_id)
-        cls = config.__class__
+    config = get_pretrained_config(model_id)
+    if verbose:
+        print(f"[get_untrained_model_with_inputs] cls={config.__class__.__name__!r}")
+    task = task_from_arch(arch)
     if verbose:
-        print(f"[get_untrained_model_with_inputs] cls={cls.__name__!r}")
+        print(f"[get_untrained_model_with_inputs] task={task!r}")
 
-    # model creation
-    kwargs: Dict[str, Any] = dict(
-        num_hidden_layers=1,
-    )
+    # model kwagrs
     if dynamic_rope is not None:
-        kwargs["rope_scaling"] = (
+        config.rope_scaling = (
             {"rope_type": "dynamic", "factor": 10.0} if dynamic_rope else None
         )
     if model_kwargs:
-        kwargs.update(model_kwargs)
-    config = cls(**kwargs)
-    task = task_from_arch(arch)
-    if verbose:
-        print(f"[get_untrained_model_with_inputs] task={task!r}")
+        for k, v in model_kwargs.items():
+            setattr(config, k, v)
 
     if task == "text-generation":
         kwargs = dict(
@@ -136,7 +126,7 @@ def get_untrained_model_with_inputs(
             head_dim=getattr(
                 config, "head_dim", config.hidden_size // config.num_attention_heads
             ),
-            max_token_id=config.vocab_size - 1,
+            dummy_max_token_id=config.vocab_size - 1,
             num_hidden_layers=min(config.num_hidden_layers, 2),
             num_key_value_heads=(
                 config.num_key_value_heads
@@ -154,25 +144,29 @@ def get_untrained_model_with_inputs(
                 else config.hidden_size
             ),
         )
-        if inputs_kwargs:
-            kwargs.update(inputs_kwargs)
 
-        _update_config(config, kwargs)
-        model = getattr(transformers, arch)(config)
         fct = get_inputs_for_text_generation
     elif task == "image-classification":
-        kwargs = dict(
-            batch_size=2,
-            width=config.image_size,
-            height=config.image_size,
-            channels=config.num_channels,
-        )
-        if inputs_kwargs:
-            kwargs.update(inputs_kwargs)
+        if isinstance(config.image_size, int):
+            kwargs = dict(
+                batch_size=2,
+                input_width=config.image_size,
+                input_height=config.image_size,
+                input_channels=config.num_channels,
+            )
+        else:
+            kwargs = dict(
+                batch_size=2,
+                input_width=config.image_size[0],
+                input_height=config.image_size[1],
+                input_channels=config.num_channels,
+            )
         fct = get_inputs_for_image_classification
     else:
         raise NotImplementedError(f"Input generation for task {task!r} not implemented yet.")
 
+    if inputs_kwargs:
+        kwargs.update(inputs_kwargs)
     true_kwargs = (inputs_kwargs or {}) if same_as_pretrained else kwargs
     _update_config(config, true_kwargs)
     model = getattr(transformers, arch)(config)
@@ -192,7 +186,7 @@ def compute_model_size(model: torch.nn.Module) -> Tuple[int, int]:
 def get_inputs_for_text_generation(
     model: torch.nn.Module,
     config: Optional[Any],
-    max_token_id: int,
+    dummy_max_token_id: int,
     num_key_value_heads: int,
     num_hidden_layers: int,
     head_dim: int,
@@ -208,6 +202,7 @@ def get_inputs_for_text_generation(
     :param model: model to get the missing information
     :param config: configuration used to generate the model
     :param head_dim: last dimension of the cache
+    :param dummy_max_token_id: dummy max token id
     :param batch_size: batch size
     :param sequence_length: sequence length
     :param sequence_length2: new sequence length
@@ -235,7 +230,7 @@ def get_inputs_for_text_generation(
         ],
     }
     inputs = dict(
-        input_ids=torch.randint(0, max_token_id, (batch_size, sequence_length2)).to(
+        input_ids=torch.randint(0, dummy_max_token_id, (batch_size, sequence_length2)).to(
             torch.int64
         ),
         attention_mask=torch.ones((batch_size, sequence_length + sequence_length2)).to(
@@ -268,9 +263,9 @@ def get_inputs_for_text_generation(
 def get_inputs_for_image_classification(
     model: torch.nn.Module,
     config: Optional[Any],
-    width: int,
-    height: int,
-    channels: int,
+    input_width: int,
+    input_height: int,
+    input_channels: int,
     batch_size: int = 2,
     dynamic_rope: bool = False,
     **kwargs,
@@ -281,9 +276,18 @@ def get_inputs_for_image_classification(
     :param model: model to get the missing information
     :param config: configuration used to generate the model
     :param batch_size: batch size
+    :param input_channel: input channel
+    :param input_width: input width
+    :param input_height: input height
     :param kwargs: to overwrite the configuration, example ``num_hidden_layers=1``
     :return: dictionary
     """
+    assert isinstance(
+        input_width, int
+    ), f"Unexpected type for input_width {type(input_width)}{config}"
+    assert isinstance(
+        input_width, int
+    ), f"Unexpected type for input_height {type(input_height)}{config}"
 
     shapes = {
         "pixel_values": {
@@ -293,7 +297,9 @@ def get_inputs_for_image_classification(
         },
     }
     inputs = dict(
-        pixel_values=torch.randn(batch_size, channels, width, height).clamp(-1, 1),
+        pixel_values=torch.randn(batch_size, input_channels, input_width, input_height).clamp(
+            -1, 1
+        ),
     )
     sizes = compute_model_size(model)
     return dict(