Fix formatting

qgp · qgp · commit 24e9846e3a29 · 2025-08-29T10:27:45.000+02:00
diff --git a/machine_learning_hep/multiprocesser.py b/machine_learning_hep/multiprocesser.py
@@ -16,16 +16,18 @@
 main script for doing data processing, machine learning and analysis
 """
 
-from functools import reduce
 import os
 import tempfile
+from functools import reduce
 from typing import TypeVar
 
 from machine_learning_hep.io_ml_utils import dump_yaml_from_dict, parse_yaml
 from machine_learning_hep.logger import get_logger
 from machine_learning_hep.utilities import merge_method, mergerootfiles
+
 from .common import DataType
 
+
 class MultiProcesser:  # pylint: disable=too-many-instance-attributes, too-many-statements, consider-using-f-string, too-many-branches
     species = "multiprocesser"
     logger = get_logger()
@@ -111,8 +113,12 @@ def __init__(self, case, proc_class, datap, typean, run_param, datatype):
         self.lper_evtorig = [os.path.join(direc, self.n_evtorig) for direc in self.dlper_pkl]
 
         dp = self.cfg(f"mlapplication.{self.datatype.value}", {})
-        self.dlper_reco_modapp = [self.d_prefix_app + p for p in dp["pkl_skimmed_dec"]] if dp else [None] * len(self.p_period)
-        self.dlper_reco_modappmerged = [self.d_prefix_app + p for p in dp["pkl_skimmed_decmerged"]] if dp else [None] * len(self.p_period)
+        self.dlper_reco_modapp = (
+            [self.d_prefix_app + p for p in dp["pkl_skimmed_dec"]] if dp else [None] * len(self.p_period)
+        )
+        self.dlper_reco_modappmerged = (
+            [self.d_prefix_app + p for p in dp["pkl_skimmed_decmerged"]] if dp else [None] * len(self.p_period)
+        )
 
         dp = self.cfg(f"analysis.{self.typean}.{self.datatype.value}", {})
         self.d_results = [self.d_prefix_res + os.path.expandvars(p) for p in dp["results"]]
@@ -121,7 +127,9 @@ def __init__(self, case, proc_class, datap, typean, run_param, datatype):
         self.f_evt_mergedallp = os.path.join(self.d_pklevt_mergedallp, self.n_evt)
         self.f_evtorig_mergedallp = os.path.join(self.d_pklevt_mergedallp, self.n_evtorig)
 
-        self.lper_runlistrigger = self.cfg(f"analysis.{self.typean}.{self.datatype.value}.runselection", [None] * len(self.p_period))
+        self.lper_runlistrigger = self.cfg(
+            f"analysis.{self.typean}.{self.datatype.value}.runselection", [None] * len(self.p_period)
+        )
 
         self.lper_mcreweights = None
         if self.datatype == DataType.MC:
diff --git a/machine_learning_hep/processer.py b/machine_learning_hep/processer.py
@@ -219,18 +219,18 @@ def __init__(
         # Potentially mask certain values (e.g. nsigma TOF of -999)
         self.p_mask_values = datap["ml"].get("mask_values", None)
 
-        self.bins_skimming = np.array(list(zip(self.lpt_anbinmin, self.lpt_anbinmax, strict=False)), "d")
-        self.bins_analysis = np.array(list(zip(self.lpt_finbinmin, self.lpt_finbinmax, strict=False)), "d")
+        self.bins_skimming = np.array(list(zip(self.lpt_anbinmin, self.lpt_anbinmax, strict=True)), "d")
+        self.bins_analysis = np.array(list(zip(self.lpt_finbinmin, self.lpt_finbinmax, strict=True)), "d")
         bin_matching = [
             [ptrange[0] <= bin[0] and ptrange[1] >= bin[1] for ptrange in self.bins_skimming].index(True)
             for bin in self.bins_analysis
         ]
 
         self.lpt_probcutpre = self.cfg_global(f"mlapplication.probcutpresel.{self.datatype}", [None] * self.p_nptbins)
-        lpt_probcutfin_tmp = self.cfg_global(f"mlapplication.probcutoptimal", [None] * self.p_nptfinbins)
+        lpt_probcutfin_tmp = self.cfg_global("mlapplication.probcutoptimal", [None] * self.p_nptfinbins)
         self.lpt_probcutfin = [lpt_probcutfin_tmp[bin_matching[ibin]] for ibin in range(self.p_nptfinbins)]
 
-        if self.datatype in ('mc', 'data'):
+        if self.datatype in ("mc", "data"):
             for ibin, probcutfin in enumerate(self.lpt_probcutfin):
                 probcutpre = self.lpt_probcutpre[bin_matching[ibin]]
                 if self.mltype == "MultiClassification":
@@ -254,7 +254,7 @@ def __init__(
                 for ipt in range(self.p_nptfinbins):
                     mlsel_multi = [
                         f"y_test_prob{self.p_modelname}{label.replace('-', '_')} {comp} {probcut}"
-                        for label, comp, probcut in zip(self.class_labels, comps, self.lpt_probcutfin[ipt], strict=False)
+                        for label, comp, probcut in zip(self.class_labels, comps, self.lpt_probcutfin[ipt], strict=True)
                 ]
 
         self.d_pkl_dec = d_pkl_dec
@@ -291,7 +291,7 @@ def __init__(
         )
 
         self.lpt_recodec = None
-        if self.doml and self.datatype in ('mc', 'data'):
+        if self.doml and self.datatype in ("mc", "data"):
             if self.mltype == "MultiClassification":
                 self.lpt_recodec = [
                     self.n_reco.replace(
@@ -320,22 +320,30 @@ def __init__(
                 for i in range(self.p_nptbins)
             ]
 
-        self.mptfiles_recosk = [
-            createlist(self.d_pklsk, self.l_path, self.lpt_recosk[ipt]) for ipt in range(self.p_nptbins)
-        ] if self.datatype in ('mc', 'data') else []
-        self.mptfiles_recoskmldec = [
-            createlist(self.d_pkl_dec, self.l_path, self.lpt_recodec[ipt]) for ipt in range(self.p_nptbins)
-        ] if self.datatype in ('mc', 'data') else []
-        self.lpt_recodecmerged = [
-            os.path.join(self.d_pkl_decmerged, self.lpt_recodec[ipt]) for ipt in range(self.p_nptbins)
-        ] if self.datatype in ('mc', 'data') else []
-        if self.datatype in ('mc', 'fd'):
+        self.mptfiles_recosk = (
+            [createlist(self.d_pklsk, self.l_path, self.lpt_recosk[ipt]) for ipt in range(self.p_nptbins)]
+            if self.datatype in ("mc", "data")
+            else []
+        )
+        self.mptfiles_recoskmldec = (
+            [createlist(self.d_pkl_dec, self.l_path, self.lpt_recodec[ipt]) for ipt in range(self.p_nptbins)]
+            if self.datatype in ("mc", "data")
+            else []
+        )
+        self.lpt_recodecmerged = (
+            [os.path.join(self.d_pkl_decmerged, self.lpt_recodec[ipt]) for ipt in range(self.p_nptbins)]
+            if self.datatype in ("mc", "data")
+            else []
+        )
+        if self.datatype in ("mc", "fd"):
             self.mptfiles_gensk = [
                 createlist(self.d_pklsk, self.l_path, self.lpt_gensk[ipt]) for ipt in range(self.p_nptbins)
             ]
-            self.lpt_gendecmerged = [
-                os.path.join(self.d_pkl_decmerged, self.lpt_gensk[ipt]) for ipt in range(self.p_nptbins)
-            ] if self.d_pkl_decmerged else []
+            self.lpt_gendecmerged = (
+                [os.path.join(self.d_pkl_decmerged, self.lpt_gensk[ipt]) for ipt in range(self.p_nptbins)]
+                if self.d_pkl_decmerged
+                else []
+            )
             self.mptfiles_gensk_sl = (
                 [createlist(self.d_pklsk, self.l_path, self.lpt_gensk_sl[ipt]) for ipt in range(self.p_nptbins)]
                 if self.lpt_gensk_sl
@@ -378,10 +386,10 @@ def dfread(rdir, trees, cols, idx_name=None):
                     trees = [trees]
                     cols = [cols]
                 # if all(type(var) is str for var in vars): vars = [vars]
-                if not all((name in rdir for name in trees)):
+                if not all(name in rdir for name in trees):
                     self.logger.critical("Missing trees: %s", trees)
                 df = None
-                for tree, col in zip([rdir[name] for name in trees], cols, strict=False):
+                for tree, col in zip([rdir[name] for name in trees], cols, strict=True):
                     try:
                         data = tree.arrays(expressions=col, library="np")
                         dfnew = pd.DataFrame(columns=col, data=data)
@@ -448,7 +456,7 @@ def dfuse(df_spec):
                     if dfuse(df_spec):
                         trees = []
                         cols = []
-                        for tree, spec in zip(df_spec["trees"].keys(), df_spec["trees"].values(), strict=False):
+                        for tree, spec in zip(df_spec["trees"].keys(), df_spec["trees"].values(), strict=True):
                             if isinstance(spec, list):
                                 trees.append(tree)
                                 cols.append(spec)
@@ -547,8 +555,8 @@ def dfuse(df_spec):
 
     def skim(self, file_index):
         dfreco = read_df(self.l_reco[file_index]) if self.datatype != "fd" else None
-        dfgen = read_df(self.l_gen[file_index]) if self.datatype in ('mc', 'fd') else None
-        dfgen_sl = read_df(self.l_gen_sl[file_index]) if self.n_gen_sl and self.datatype in ('mc', 'fd') else None
+        dfgen = read_df(self.l_gen[file_index]) if self.datatype in ("mc", "fd") else None
+        dfgen_sl = read_df(self.l_gen_sl[file_index]) if self.n_gen_sl and self.datatype in ("mc", "fd") else None
 
         for ipt in range(self.p_nptbins):
             if dfreco is not None: