Add functions to compare side-by-side (#184)

xadupre · web-flow · commit ebecb6747beb · 2025-07-10T01:12:32.000+02:00
* refactoring

* mypy

* fix

* first sbs

* mypy

* better agg

* sbs

* fix

* sbs

* fix sbs

* code change
diff --git a/CHANGELOGS.rst b/CHANGELOGS.rst
@@ -4,6 +4,8 @@ Change Logs
 0.7.5
 +++++
 
+* :pr:`184`: implements side-by-side
+
 0.7.4
 +++++
 
diff --git a/_unittests/ut_helpers/test_log_helper.py b/_unittests/ut_helpers/test_log_helper.py
@@ -470,6 +470,150 @@ def test_historical_cube_time_mask(self):
         cube = CubeLogs(df, keys=["^m_*", "exporter"], time="date").load()
         cube.to_excel(output, views=["time_p"], time_mask=True, verbose=1)
 
+    def test_cube_sbs_no_time(self):
+        df = pandas.DataFrame(
+            [
+                dict(
+                    date="2025/01/01",
+                    time_p=0.51,
+                    exporter="E1",
+                    opt="O",
+                    perf=3.7,
+                    m_name="A",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/01",
+                    time_p=0.51,
+                    perf=3.4,
+                    exporter="E2",
+                    opt="O",
+                    m_name="A",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/01",
+                    time_p=0.71,
+                    perf=3.5,
+                    exporter="E2",
+                    opt="O",
+                    m_name="B",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/01",
+                    time_p=0.71,
+                    perf=3.6,
+                    exporter="E2",
+                    opt="K",
+                    m_name="B",
+                    m_cls="CA",
+                ),
+            ]
+        )
+        cube = CubeLogs(
+            df, keys=["^m_*", "exporter", "opt"], values=["time_p", "perf"], time="date"
+        ).load()
+        sbs, sbs_agg = cube.sbs(
+            dict(CFA=dict(exporter="E1", opt="O"), CFB=dict(exporter="E2", opt="O"))
+        )
+        self.assertEqual(sbs.shape, (4, 9))
+        self.assertEqual(sbs.index.names, ["METRICS", "m_name", "date"])
+        self.assertEqual(sorted(sbs.columns.names), ["CONF", "exporter"])
+        self.assertEqual(sbs_agg.shape, (2, 9))
+        self.assertEqual(sbs_agg.index.names, ["date", "METRICS"])
+        self.assertEqual(sorted(sbs_agg.columns.names), ["CONF", "exporter"])
+
+    def test_cube_sbs_with_time(self):
+        df = pandas.DataFrame(
+            [
+                dict(
+                    date="2025/01/01",
+                    time_p=0.51,
+                    exporter="E1",
+                    opt="O",
+                    perf=3.7,
+                    m_name="A",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/01",
+                    time_p=0.51,
+                    perf=3.4,
+                    exporter="E2",
+                    opt="O",
+                    m_name="A",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/01",
+                    time_p=0.71,
+                    perf=3.5,
+                    exporter="E2",
+                    opt="O",
+                    m_name="B",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/01",
+                    time_p=0.71,
+                    perf=3.6,
+                    exporter="E2",
+                    opt="K",
+                    m_name="B",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/02",
+                    time_p=0.51,
+                    exporter="E1",
+                    opt="O",
+                    perf=3.7,
+                    m_name="A",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/02",
+                    time_p=0.51,
+                    perf=3.4,
+                    exporter="E2",
+                    opt="O",
+                    m_name="A",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/02",
+                    time_p=0.71,
+                    perf=3.5,
+                    exporter="E2",
+                    opt="O",
+                    m_name="B",
+                    m_cls="CA",
+                ),
+                dict(
+                    date="2025/01/02",
+                    time_p=0.71,
+                    perf=3.6,
+                    exporter="E2",
+                    opt="K",
+                    m_name="B",
+                    m_cls="CA",
+                ),
+            ]
+        )
+        cube = CubeLogs(
+            df, keys=["^m_*", "exporter", "opt"], values=["time_p", "perf"], time="date"
+        ).load()
+        sbs, sbs_agg = cube.sbs(
+            dict(CFA=dict(exporter="E1", opt="O"), CFB=dict(exporter="E2", opt="O"))
+        )
+        self.assertEqual(sbs.shape, (8, 9))
+        self.assertEqual(sbs.index.names, ["METRICS", "m_name", "date"])
+        self.assertEqual(sorted(sbs.columns.names), ["CONF", "exporter"])
+        self.assertEqual(sbs_agg.shape, (4, 9))
+        self.assertEqual(sbs_agg.index.names, ["date", "METRICS"])
+        self.assertEqual(sorted(sbs_agg.columns.names), ["CONF", "exporter"])
+
 
 if __name__ == "__main__":
     unittest.main(verbosity=2)
diff --git a/onnx_diagnostic/_command_lines_parser.py b/onnx_diagnostic/_command_lines_parser.py
@@ -645,6 +645,27 @@ def _cmd_stats(argv: List[Any]):
         print("done.")
 
 
+class _ParseNamedDict(argparse.Action):
+    def __call__(self, parser, namespace, values, option_string=None):
+        assert ":" in values, f"':' missing from {values!r}"
+        namespace_key, rest = values.split(":", 1)
+        pairs = rest.split(",")
+        inner_dict = {}
+
+        for pair in pairs:
+            if "=" not in pair:
+                raise argparse.ArgumentError(self, f"Expected '=' in pair '{pair}'")
+            key, value = pair.split("=", 1)
+            inner_dict[key] = value
+        assert inner_dict, f"Unable to parse {rest!r} into a dictionary"
+        if not hasattr(namespace, self.dest) or getattr(namespace, self.dest) is None:
+            setattr(namespace, self.dest, {})
+        assert isinstance(
+            getattr(namespace, self.dest), dict
+        ), f"Unexpected type for namespace.{self.dest}={getattr(namespace, self.dest)}"
+        getattr(namespace, self.dest).update({namespace_key: inner_dict})
+
+
 def get_parser_agg() -> ArgumentParser:
     parser = ArgumentParser(
         prog="agg",
@@ -653,6 +674,9 @@ def get_parser_agg() -> ArgumentParser:
             Aggregates statistics coming from benchmarks.
             Every run is a row. Every row is indexed by some keys,
             and produces values. Every row has a date.
+            The data can come any csv files produces by benchmarks,
+            it can concatenates many csv files, or csv files inside zip files.
+            It produces an excel file with many tabs, one per view.
             """
         ),
         epilog=textwrap.dedent(
@@ -744,7 +768,15 @@ def get_parser_agg() -> ArgumentParser:
         "--views",
         default="agg-suite,agg-all,disc,speedup,time,time_export,err,cmd,"
         "bucket-speedup,raw-short,counts,peak-gpu,onnx",
-        help="Views to add to the output files.",
+        help=textwrap.dedent(
+            """
+            Views to add to the output files. Each view becomes a tab.
+            A view is defined by its name, among
+            agg-suite, agg-all, disc, speedup, time, time_export, err,
+            cmd, bucket-speedup, raw-short, counts, peak-gpu, onnx.
+            Their definition is part of class CubeLogsPerformance.
+            """
+        ),
     )
     parser.add_argument(
         "--csv",
@@ -764,6 +796,18 @@ def get_parser_agg() -> ArgumentParser:
         help="adds a filter to filter out data, syntax is\n"
         '``"<column1>:<value1>;<value2>/<column2>:<value3>"`` ...',
     )
+    parser.add_argument(
+        "--sbs",
+        help=textwrap.dedent(
+            """
+            Defines an exporter to compare to another, there must be at least
+            two arguments defined with --sbs. Example:
+                --sbs dynamo:exporter=onnx-dynamo,opt=ir,attn_impl=eager
+                --sbs custom:exporter=custom,opt=default,attn_impl=eager
+            """
+        ),
+        action=_ParseNamedDict,
+    )
     return parser
 
 
@@ -816,6 +860,7 @@ def _cmd_agg(argv: List[Any]):
         csv=args.csv.split(","),
         raw=args.raw,
         time_mask=True,
+        sbs=args.sbs,
     )
     if args.verbose:
         print(f"Wrote {args.output!r}")
diff --git a/onnx_diagnostic/helpers/_log_helper.py b/onnx_diagnostic/helpers/_log_helper.py
@@ -320,6 +320,7 @@ def apply_excel_style(
         Dict[str, Callable[[Any], "CubeViewDef.HighLightKind"]]  # noqa: F821
     ] = None,
     time_mask_view: Optional[Dict[str, pandas.DataFrame]] = None,
+    verbose: int = 0,
 ):
     """
     Applies styles on all sheets in a file unless the sheet is too big.
@@ -329,6 +330,7 @@ def apply_excel_style(
     :param time_mask_view: if specified, it contains dataframe with the same shape
         and values in {-1, 0, +1} which indicates if a value is unexpectedly lower (-1)
         or higher (+1), it changes the color of the background then.
+    :param verbosity: progress loop
     """
     from openpyxl import load_workbook
     from openpyxl.styles import Alignment
@@ -353,8 +355,13 @@ def apply_excel_style(
         CubeViewDef.HighLightKind.GREEN: Font(color="00AA00"),
         CubeViewDef.HighLightKind.RED: Font(color="FF0000"),
     }
+    if verbose:
+        from tqdm import tqdm
 
-    for name in workbook.sheetnames:
+        sheet_names = tqdm(list(workbook.sheetnames))
+    else:
+        sheet_names = workbook.sheetnames
+    for name in sheet_names:
         if time_mask_view and name in time_mask_view:
             mask = time_mask_view[name]
             with pandas.ExcelWriter(io.BytesIO(), engine="openpyxl") as mask_writer:
@@ -367,7 +374,7 @@ def apply_excel_style(
         sheet = workbook[name]
         n_rows = sheet.max_row
         n_cols = sheet.max_column
-        if n_rows * n_cols > 2**18:
+        if n_rows * n_cols > 2**16 or n_rows > 2**13:
             # Too big.
             continue
         co: Dict[int, int] = {}
diff --git a/onnx_diagnostic/helpers/log_helper.py b/onnx_diagnostic/helpers/log_helper.py

-Original file line number
+Diff line change
 .7.5
 +++++
 +* :pr:`184`: implements side-by-side
++
 .7.4
 +++++