First step for TorchEvaluator (#116)

xadupre · web-flow · commit fe286f1c7119 · 2025-05-30T23:20:30.000+02:00
* draft

* First step for TorchEvaluator

* changes

* mypy

* mypy

* mypy
diff --git a/CHANGELOGS.rst b/CHANGELOGS.rst
@@ -4,13 +4,14 @@ Change Logs
 0.6.1
 +++++
 
+* :pr:`115`, :pr:`116`: first steps for TorchEvaluator
 * :pr:`114`: extends the list of known rewritings
 * :pr:`113`: fixes a couple of issues with ModelBuilder
 
 0.6.0
 +++++
 
-* :pr:`111`: support ModelBuilder with command line validatz
+* :pr:`111`: support ModelBuilder with command line validate
 * :pr:`108`, :pr:`109`, :pr:`110`: first version of an algorithm rendering
   small onnx graph in ascii, patch for ``torch.vmap``
 
diff --git a/_doc/api/reference/index.rst b/_doc/api/reference/index.rst
@@ -6,6 +6,7 @@ onnx_diagnostic.reference
     :caption: submodules
 
     ops/index
+    torch_ops/index
 
 .. toctree::
     :maxdepth: 1
@@ -14,6 +15,7 @@ onnx_diagnostic.reference
     evaluator
     quantized_tensor
     ort_evaluator
+    torch_evaluator
 
 ExtendedReferenceEvaluator
 ++++++++++++++++++++++++++
@@ -27,6 +29,12 @@ OnnxruntimeEvaluator
 .. autoclass:: onnx_diagnostic.reference.OnnxruntimeEvaluator
     :members:
 
+TorchEvaluator
+++++++++++++++
+
+.. autoclass:: onnx_diagnostic.reference.TorchEvaluator
+    :members:
+
 Other functions
 +++++++++++++++
 
diff --git a/_doc/api/reference/torch_evaluator.rst b/_doc/api/reference/torch_evaluator.rst
@@ -0,0 +1,8 @@
+
+onnx_diagnostic.reference.torch_evaluator
+=========================================
+
+.. automodule:: onnx_diagnostic.reference.torch_evaluator
+    :members:
+    :no-undoc-members:
+    :exclude-members: TorchEvaluator
diff --git a/_doc/api/reference/torch_ops/binary_ops.rst b/_doc/api/reference/torch_ops/binary_ops.rst
@@ -0,0 +1,6 @@
+
+onnx_diagnostic.reference.torch_ops.binary_ops
+==============================================
+
+.. automodule:: onnx_diagnostic.reference.torch_ops.binary_ops
+    :members:
diff --git a/_doc/api/reference/torch_ops/index.rst b/_doc/api/reference/torch_ops/index.rst
@@ -0,0 +1,23 @@
+
+onnx_diagnostic.reference.torch_ops
+===================================
+
+
+.. toctree::
+    :maxdepth: 1
+    :caption: modules
+
+    binary_ops
+
+OpRun
++++++
+
+.. autoclass:: onnx_diagnostic.reference.torch_ops.OpRun
+    :members:
+
+Other functions
++++++++++++++++
+
+.. automodule:: onnx_diagnostic.reference.torch_ops
+    :members:
+    :no-undoc-members:
diff --git a/_doc/api/torch_onnx/index.rst b/_doc/api/torch_onnx/index.rst
@@ -5,6 +5,7 @@ onnx_diagnostic.torch_onnx
     :maxdepth: 1
     :caption: submodules
 
+    runtime_info
     sbs
 
 .. automodule:: onnx_diagnostic.torch_onnx
diff --git a/_doc/api/torch_onnx/runtime_info.rst b/_doc/api/torch_onnx/runtime_info.rst
@@ -0,0 +1,7 @@
+
+onnx_diagnostic.torch_onnx.runtime_info
+=======================================
+
+.. automodule:: onnx_diagnostic.torch_onnx.runtime_info
+    :members:
+    :no-undoc-members:
diff --git a/_unittests/ut_reference/test_torch_evaluator.py b/_unittests/ut_reference/test_torch_evaluator.py
@@ -0,0 +1,77 @@
+import unittest
+import numpy as np
+import onnx
+import onnx.helper as oh
+import onnx.numpy_helper as onh
+import torch
+from onnx_diagnostic.ext_test_case import ExtTestCase
+from onnx_diagnostic.reference import ExtendedReferenceEvaluator, TorchEvaluator
+from onnx_diagnostic.reference.torch_evaluator import get_kernels
+
+
+TFLOAT = onnx.TensorProto.FLOAT
+
+
+class TestTorchEvaluator(ExtTestCase):
+    def test_kernels(self):
+        ker = get_kernels()
+        self.assertIsInstance(ker, dict)
+        key = "", "Add", 1
+        self.assertIn(key, ker)
+        kernel = ker[key]
+        self.assertEqual("Add_1", kernel.__name__)
+
+    def test_binary_ops(self):
+        model = oh.make_model(
+            oh.make_graph(
+                [
+                    oh.make_node("Add", ["X", "un"], ["xy"]),
+                    oh.make_node("Mul", ["xy", "Y"], ["xyy"]),
+                    oh.make_node(
+                        "Constant",
+                        [],
+                        ["deux"],
+                        value=onh.from_array(np.array([2], dtype=np.float32)),
+                    ),
+                    oh.make_node("Div", ["xyy", "deux"], ["xyyy"]),
+                    oh.make_node("Sub", ["xyyy", "Y"], ["Z"]),
+                ],
+                "dummy",
+                [
+                    oh.make_tensor_value_info("X", TFLOAT, ["a", "b"]),
+                    oh.make_tensor_value_info("Y", TFLOAT, ["a", "b"]),
+                ],
+                [oh.make_tensor_value_info("Z", TFLOAT, ["a", "b"])],
+                [onh.from_array(np.array([1], dtype=np.float32), name="un")],
+            ),
+            ir_version=9,
+            opset_imports=[oh.make_opsetid("", 18)],
+        )
+        onnx.checker.check_model(model)
+
+        rt = TorchEvaluator(model)
+        self.assertEqual(5, len(rt.kernels))
+        self.assertEqual(2, len(rt.constants))
+
+        feeds = dict(
+            X=torch.rand((4, 5), dtype=torch.float32),
+            Y=torch.rand((4, 5), dtype=torch.float32),
+        )
+
+        expected = ExtendedReferenceEvaluator(model).run(
+            None, {k: v.numpy() for k, v in feeds.items()}
+        )
+        got = rt.run(None, feeds)
+        self.assertEqualAny(expected, [g.detach().numpy() for g in got])
+        self.assertEqual(len(rt.last_used), len(model.graph.node))
+        self.assertEqual(len(rt.kernels), len(model.graph.node))
+        self.assertEqual([["X"], ["xy"], [], ["xyy"], ["Y", "xyyy"]], rt.last_used)
+        for k, v in rt.runtime_info.items():
+            if k in {"un", "deux"}:
+                self.assertNotEmpty(v.value)
+            else:
+                self.assertEmpty(v.value)
+
+
+if __name__ == "__main__":
+    unittest.main(verbosity=2)
diff --git a/onnx_diagnostic/reference/__init__.py b/onnx_diagnostic/reference/__init__.py
@@ -1,2 +1,3 @@
 from .evaluator import ExtendedReferenceEvaluator
 from .ort_evaluator import OnnxruntimeEvaluator
+from .torch_evaluator import TorchEvaluator
diff --git a/onnx_diagnostic/reference/torch_evaluator.py b/onnx_diagnostic/reference/torch_evaluator.py
@@ -0,0 +1,185 @@
+import functools
+from typing import Dict, List, Optional, Sequence, Tuple, Union
+import onnx
+import torch
+from ..helpers.torch_helper import to_tensor
+from ..torch_onnx.runtime_info import first_used_last_used
+from . import torch_ops
+
+
+@functools.lru_cache
+def get_kernels() -> Dict[Tuple[str, str, int], type[torch_ops.OpRun]]:
+    """Retrieves all the available kernels."""
+    res = {}
+    for _k, v in torch_ops.__dict__.items():
+        if isinstance(v, type) and issubclass(v, torch_ops.OpRun) and "_" in v.__name__:
+            name, version = v.__name__.split("_")
+            domain = getattr(v, "domain", "")
+            res[domain, name, int(version)] = v
+    return res
+
+
+class TorchEvaluator:
+    """
+    Torch evaluator for onnx models.
+    The model does not stores the original proto it evaluates to avoid
+
+    :param proto: a proto
+    :param providers: where to run the model
+    :param opsets: needed if proto is a graph
+
+    The class holds the following attributes:
+
+    * `providers`: providers
+    * `default_device`: default torch device
+    * `constants`: all initializers or constants
+    * `kernels`: kernels
+    * `runtime_info`: produced by :func:`first_used_last_used
+      <onnx_diagnostic.torch_onnx.runtime_info.first_used_last_used>`
+    * `last_used`: contains the list of intermediate results,
+       to remove after every node execution,
+       this avoid the memory to grow too much
+
+    The class is not multithreaded. `runtime_info` gets updated
+    by the the class.
+    """
+
+    def __init__(
+        self,
+        proto: Union[onnx.FunctionProto, onnx.GraphProto, onnx.ModelProto],
+        providers: Tuple[str, ...] = ("CPUExecutionProvider",),
+        opsets: Optional[Dict[str, int]] = None,
+    ):
+        self.providers = providers
+        self.constants: Dict[str, torch.Tensor] = {}
+        self.kernels: List[Optional[torch_ops.OpRun]] = []
+        self.CPU = torch.tensor([0]).to("cpu").device
+        if "CUDAExecutionProvider" in providers:
+            self.CUDA = torch.tensor([0]).to("cuda").device
+            self.default_device = self.CUDA
+        else:
+            self.default_device = self.CPU
+
+        if isinstance(proto, onnx.ModelProto):
+            assert opsets is None, "proto is a model, opsets must be None in that case"
+            assert not proto.graph.sparse_initializer, "sparse_initializer not support yet"
+            self.opsets = {d.domain: d.version for d in proto.opset_import}
+            self._build_initializers(proto.graph.initializer)
+            self._build_initializers(proto.graph.node)
+            self._build_kernels(proto.graph.node)
+            self.input_names = [i.name for i in proto.graph.input]
+            self.output_names = [i.name for i in proto.graph.output]
+        elif isinstance(proto, onnx.GraphProto):
+            assert opsets, "opsets must be specified if proto is a graph"
+            assert not proto.sparse_initializer, "sparse_initializer not support yet"
+            self.opsets = opsets
+            self._build_initializers(proto)
+            self._build_initializers(proto.node)
+            self._build_kernels(proto.nodes)
+            self.input_names = [i.name for i in proto.input]
+            self.output_names = [i.name for i in proto.output]
+        elif isinstance(proto, onnx.FunctionProto):
+            assert opsets is None, "proto is a model, opsets must be None in that case"
+            self.opsets = {d.domain: d.version for d in proto.opset_import}
+            self._build_initializers(proto.node)
+            self._build_kernels(proto.node)
+            self.input_names = list(proto.input)
+            self.output_names = list(proto.output)
+        else:
+            raise TypeError(f"Unexpected type {type(proto)} for proto")
+
+        self.runtime_info = first_used_last_used(proto, constant_as_initializer=True)
+        self.last_used: List[List[str]] = [[] for _ in self.kernels]
+        for name, info in self.runtime_info.items():
+            assert isinstance(info.last_used, int), f"Missing field last_used in {info!r}"
+            if not info.is_output and not info.is_initializer:
+                self.last_used[info.last_used].append(name)
+
+    @property
+    def on_cuda(self) -> bool:
+        return self.default_device == self.CUDA
+
+    def _build_initializers(self, inits: Sequence[Union[onnx.NodeProto, onnx.TensorProto]]):
+        for init in inits:
+            if isinstance(init, onnx.TensorProto):
+                self.constants[init.name] = to_tensor(init).to(self.default_device)
+            elif (
+                isinstance(init, onnx.NodeProto)
+                and init.op_type == "Constant"
+                and init.domain == ""
+            ):
+                value = None
+                for att in init.attribute:
+                    if att.name == "value":
+                        value = to_tensor(att.t).to(self.default_device)
+                assert value is not None, f"No attribute value in node {init}"
+                self.constants[init.output[0]] = value
+
+    def _build_kernels(self, nodes: Sequence[onnx.NodeProto]):
+        kernels = get_kernels()
+        self.kernels.clear()
+        for node in nodes:
+            if node.op_type == "Constant" and node.domain == "":
+                # Treated as a constant.
+                self.kernels.append(None)
+                continue
+            opset = self.opsets[node.domain]
+            key = node.domain, node.op_type, opset
+            while key not in kernels:
+                opset -= 1
+                key = node.domain, node.op_type, opset
+            assert (
+                key in kernels
+            ), f"Missing kernel for node type {node.op_type!r} from domain {node.domain!r}"
+            self.kernels.append(kernels[key](node, opset))
+
+    def run(
+        self, outputs: Optional[List[str]], feeds: Dict[str, torch.Tensor]
+    ) -> List[torch.Tensor]:
+        """
+        Runs the ONNX model.
+
+        :param outputs: outputs required:
+        :param feeds: inputs
+        :return: output tensors.
+        """
+        if outputs is None:
+            outputs = self.output_names
+
+        # sets constants
+        for k, v in self.constants.items():
+            r = self.runtime_info[k]
+            if not r.has_value:
+                r.set_value(v.to(self.CUDA) if r.is_shape and self.on_cuda else v)
+
+        # inputs
+        for k, v in feeds.items():
+            r = self.runtime_info[k]
+            r.set_value(v.to(self.CUDA) if r.is_shape and self.on_cuda else v)
+
+        # node execution
+        for it, kernel in enumerate(self.kernels):
+            if kernel is not None:
+                # kernel execution
+                inputs = [(self.runtime_info[i].value if i else None) for i in kernel.input]
+                res = kernel.run(*inputs)
+                if isinstance(res, tuple):
+                    for name, t in zip(kernel.output, res):
+                        self.runtime_info[name].set_value(t)
+                else:
+                    self.runtime_info[kernel.output[0]].set_value(res)
+
+            # free intermediate results
+            for name in self.last_used[it]:
+                self.runtime_info[name].clean_value()
+
+        # outputs
+        res = [self.runtime_info[o].value for o in outputs]
+
+        # clean previous execution
+        for k in feeds:
+            self.runtime_info[k].clean_value()
+        for o in outputs:
+            self.runtime_info[o].clean_value()
+
+        return res
diff --git a/onnx_diagnostic/reference/torch_ops/__init__.py b/onnx_diagnostic/reference/torch_ops/__init__.py
@@ -0,0 +1,3 @@
+from ._op_run import OpRun
+
+from .binary_ops import Add_1, Div_1, Mul_1, Sub_1
diff --git a/onnx_diagnostic/reference/torch_ops/_op_run.py b/onnx_diagnostic/reference/torch_ops/_op_run.py
diff --git a/onnx_diagnostic/reference/torch_ops/binary_ops.py b/onnx_diagnostic/reference/torch_ops/binary_ops.py
diff --git a/onnx_diagnostic/torch_onnx/runtime_info.py b/onnx_diagnostic/torch_onnx/runtime_info.py
diff --git a/pyproject.toml b/pyproject.toml

Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,3 @@`
`1`	`1`	`from .evaluator import ExtendedReferenceEvaluator`
`2`	`2`	`from .ort_evaluator import OnnxruntimeEvaluator`
	`3`	`+from .torch_evaluator import TorchEvaluator`