Ruff and mypy fixes

XkunW · XkunW · commit 07bf6c714cd0 · 2025-12-09T17:16:08.000-05:00
diff --git a/vec_inf/cli/_helper.py b/vec_inf/cli/_helper.py
@@ -188,7 +188,8 @@ def format_table_output(self) -> Table:
                 "Memory/Node", f"  {self.params['models'][model_name]['mem_per_node']}"
             )
             table.add_row(
-                "Inference Engine", f"  {ENGINE_NAME_MAP[self.params['models'][model_name]['engine']]}"
+                "Inference Engine",
+                f"  {ENGINE_NAME_MAP[self.params['models'][model_name]['engine']]}",
             )
 
         return table
@@ -483,7 +484,7 @@ def _format_single_model_output(self, config: ModelConfig) -> Union[str, Table]:
                 config_dict["model_weights_parent_dir"]
             )
             return json.dumps(config_dict, indent=4)
-        
+
         excluded_list = ["venv", "log_dir"]
 
         table = create_table(key_title="Model Config", value_title="Value")
diff --git a/vec_inf/client/_helper.py b/vec_inf/client/_helper.py
@@ -203,17 +203,20 @@ def _process_env_vars(self, env_arg: str) -> dict[str, str]:
                     else:
                         print(f"WARNING: Could not parse env var: {line}")
         return env_vars
-    
+
     def _engine_check_override(self, params: dict[str, Any]) -> None:
         """Check for engine override in CLI args and warn user.
 
         Parameters
         ----------
         params : dict[str, Any]
             Dictionary of launch parameters to check
-        """ 
+        """
+
         def overwrite_engine_args(params: dict[str, Any]) -> None:
-            engine_args = self._process_engine_args(self.kwargs[f"{self.engine}_args"], self.engine)
+            engine_args = self._process_engine_args(
+                self.kwargs[f"{self.engine}_args"], self.engine
+            )
             for key, value in engine_args.items():
                 params["engine_args"][key] = value
             del self.kwargs[f"{self.engine}_args"]
@@ -236,10 +239,9 @@ def overwrite_engine_args(params: dict[str, Any]) -> None:
                 raise ValueError(
                     f"Mismatch between provided engine '{input_engine}' and engine-specific args '{extracted_engine}'"
                 )
-            else:
-                self.engine = input_engine
-                params["engine_args"] = params[f"{self.engine}_args"]
-                overwrite_engine_args(params)
+            self.engine = input_engine
+            params["engine_args"] = params[f"{self.engine}_args"]
+            overwrite_engine_args(params)
         elif input_engine:
             # Only engine arg in CLI, use default engine args from config
             self.engine = input_engine
@@ -255,8 +257,7 @@ def overwrite_engine_args(params: dict[str, Any]) -> None:
             self.engine = params.get("engine", "vllm")
             params["engine_args"] = params[f"{self.engine}_args"]
 
-        # Remove $ENGINE_NAME_args from params as we no longer need them, and they don't get 
-        # populated to the job json.
+        # Remove $ENGINE_NAME_args from params as they won't get populated to sjob json.
         for engine in SUPPORTED_ENGINES:
             del params[f"{engine}_args"]
 
@@ -267,9 +268,9 @@ def _apply_cli_overrides(self, params: dict[str, Any]) -> None:
         ----------
         params : dict[str, Any]
             Dictionary of launch parameters to override
-        """ 
+        """
         self._engine_check_override(params)
-        
+
         if self.kwargs.get("env"):
             env_vars = self._process_env_vars(self.kwargs["env"])
             for key, value in env_vars.items():
@@ -513,6 +514,53 @@ def _get_model_configurations(self) -> dict[str, ModelConfig]:
 
         return model_configs_dict
 
+    def _validate_resource_and_parallel_settings(
+        self,
+        config: ModelConfig,
+        model_engine_args: dict[str, Any] | None,
+        model_name: str,
+    ) -> None:
+        """Validate resource allocation and parallelization settings for each model.
+
+        Parameters
+        ----------
+        config : ModelConfig
+            Configuration of the model to validate
+        model_engine_args : dict[str, Any] | None
+            Inference engine arguments of the model to validate
+        model_name : str
+            Name of the model to validate
+
+        Raises
+        ------
+        MissingRequiredFieldsError
+            If tensor parallel size is not specified when using multiple GPUs
+        ValueError
+            If total # of GPUs requested is not a power of two
+            If mismatch between total # of GPUs requested and parallelization settings
+        """
+        if (
+            int(config.gpus_per_node) > 1
+            and (model_engine_args or {}).get("--tensor-parallel-size") is None
+        ):
+            raise MissingRequiredFieldsError(
+                f"--tensor-parallel-size is required when gpus_per_node > 1, check your configuration for {model_name}"
+            )
+
+        total_gpus_requested = int(config.gpus_per_node) * int(config.num_nodes)
+        if not utils.is_power_of_two(total_gpus_requested):
+            raise ValueError(
+                f"Total number of GPUs requested must be a power of two, check your configuration for {model_name}"
+            )
+
+        total_parallel_sizes = int(
+            (model_engine_args or {}).get("--tensor-parallel-size", "1")
+        ) * int((model_engine_args or {}).get("--pipeline-parallel-size", "1"))
+        if total_gpus_requested != total_parallel_sizes:
+            raise ValueError(
+                f"Mismatch between total number of GPUs requested and parallelization settings, check your configuration for {model_name}"
+            )
+
     def _get_launch_params(
         self, account: Optional[str] = None, work_dir: Optional[str] = None
     ) -> dict[str, Any]:
@@ -549,27 +597,9 @@ def _get_launch_params(
                 del params["models"][model_name][f"{engine}_args"]
 
             # Validate resource allocation and parallelization settings
-            if (
-                int(config.gpus_per_node) > 1
-                and (model_engine_args or {}).get("--tensor-parallel-size") is None
-            ):
-                raise MissingRequiredFieldsError(
-                    f"--tensor-parallel-size is required when gpus_per_node > 1, check your configuration for {model_name}"
-                )
-
-            total_gpus_requested = int(config.gpus_per_node) * int(config.num_nodes)
-            if not utils.is_power_of_two(total_gpus_requested):
-                raise ValueError(
-                    f"Total number of GPUs requested must be a power of two, check your configuration for {model_name}"
-                )
-
-            total_parallel_sizes = int(
-                (model_engine_args or {}).get("--tensor-parallel-size", "1")
-            ) * int((model_engine_args or {}).get("--pipeline-parallel-size", "1"))
-            if total_gpus_requested != total_parallel_sizes:
-                raise ValueError(
-                    f"Mismatch between total number of GPUs requested and parallelization settings, check your configuration for {model_name}"
-                )
+            self._validate_resource_and_parallel_settings(
+                config, model_engine_args, model_name
+            )
 
             # Convert gpus_per_node and resource_type to gres
             params["models"][model_name]["gres"] = (
diff --git a/vec_inf/client/_slurm_templates.py b/vec_inf/client/_slurm_templates.py
@@ -175,7 +175,6 @@ class SlurmScriptTemplate(TypedDict):
             'nodes=$(scontrol show hostnames "$SLURM_JOB_NODELIST")',
             "nodes_array=($nodes)",
             "head_node=${nodes_array[0]}",
-            # 'head_node_ip=$(srun --nodes=1 --ntasks=1 -w "$head_node" hostname --ip-address)',
             "NCCL_PORT=$(find_available_port $head_node 8000 65535)",
             'NCCL_INIT_ADDR="${head_node}:${NCCL_PORT}"',
             'echo "[INFO] NCCL_INIT_ADDR: $NCCL_INIT_ADDR"',
diff --git a/vec_inf/client/_utils.py b/vec_inf/client/_utils.py
@@ -77,7 +77,7 @@ def read_slurm_log(
                 json_content: dict[str, str] = json.load(file)
                 return json_content
         else:
-            with file_path.open("r", errors='replace') as file:
+            with file_path.open("r", errors="replace") as file:
                 return file.readlines()
     except FileNotFoundError:
         return f"LOG FILE NOT FOUND: {file_path}"
@@ -249,7 +249,7 @@ def load_config(config_path: Optional[str] = None) -> list[ModelConfig]:
     -----
     Configuration is loaded from:
     1. User path: specified by config_path
-    2. Default path: package's config/models.yaml or CACHED_MODEL_CONFIG_PATH if it exists
+    2. Default path: package's config/models.yaml or CACHED_MODEL_CONFIG_PATH if exists
     3. Environment variable: specified by VEC_INF_CONFIG environment variable
         and merged with default config
 

Original file line number	Diff line number	Diff line change
`@@ -188,7 +188,8 @@ def format_table_output(self) -> Table:`
`188`	`188`	`"Memory/Node", f" {self.params['models'][model_name]['mem_per_node']}"`
`189`	`189`	`)`
`190`	`190`	`table.add_row(`
`191`		`- "Inference Engine", f" {ENGINE_NAME_MAP[self.params['models'][model_name]['engine']]}"`
	`191`	`+ "Inference Engine",`
	`192`	`+ f" {ENGINE_NAME_MAP[self.params['models'][model_name]['engine']]}",`
`192`	`193`	`)`
`193`	`194`
`194`	`195`	`return table`
`@@ -483,7 +484,7 @@ def _format_single_model_output(self, config: ModelConfig) -> Union[str, Table]:`
`483`	`484`	`config_dict["model_weights_parent_dir"]`
`484`	`485`	`)`
`485`	`486`	`return json.dumps(config_dict, indent=4)`
`486`		`-`
	`487`	`+`
`487`	`488`	`excluded_list = ["venv", "log_dir"]`
`488`	`489`
`489`	`490`	`table = create_table(key_title="Model Config", value_title="Value")`