format

wjayesh · wjayesh · commit 0c8cca247b3b · 2025-02-11T13:23:45.000+05:30
diff --git a/airflow-cloud-composer-etl-feature-train/steps/training/model_trainer.py b/airflow-cloud-composer-etl-feature-train/steps/training/model_trainer.py
@@ -32,7 +32,8 @@ def train_xgboost_model(
     dataset: Union[BigQueryDataset, CSVDataset],
 ) -> Tuple[
     Annotated[
-        xgb.Booster, ArtifactConfig(name="xgb_model", artifact_type=ArtifactType.MODEL)
+        xgb.Booster,
+        ArtifactConfig(name="xgb_model", artifact_type=ArtifactType.MODEL),
     ],
     Annotated[Dict[str, float], "metrics"],
 ]:
diff --git a/databricks-production-qa-demo/pipelines/batch_inference.py b/databricks-production-qa-demo/pipelines/batch_inference.py
@@ -23,13 +23,12 @@
     notify_on_failure,
     notify_on_success,
 )
+from steps.explainability import explain_model
 from zenml import get_pipeline_context, pipeline
 from zenml.integrations.evidently.metrics import EvidentlyMetricConfig
 from zenml.integrations.evidently.steps import evidently_report_step
 from zenml.logger import get_logger
 
-from steps.explainability import explain_model
-
 logger = get_logger(__name__)
 
 
diff --git a/databricks-production-qa-demo/steps/deployment/deployment_deploy.py b/databricks-production-qa-demo/steps/deployment/deployment_deploy.py
@@ -31,14 +31,10 @@
 
 
 @step(enable_cache=False)
-def deployment_deploy() -> (
-    Annotated[
-        Optional[DatabricksDeploymentService],
-        ArtifactConfig(
-            name="databricks_deployment", is_deployment_artifact=True
-        ),
-    ]
-):
+def deployment_deploy() -> Annotated[
+    Optional[DatabricksDeploymentService],
+    ArtifactConfig(name="databricks_deployment", is_deployment_artifact=True),
+]:
     """Predictions step.
 
     This is an example of a predictions step that takes the data in and returns
diff --git a/databricks-production-qa-demo/steps/explainability/__init__.py b/databricks-production-qa-demo/steps/explainability/__init__.py
@@ -1 +1 @@
-from .shap_explainer import explain_model
+from .shap_explainer import explain_model
diff --git a/databricks-production-qa-demo/steps/explainability/shap_explainer.py b/databricks-production-qa-demo/steps/explainability/shap_explainer.py
@@ -1,20 +1,25 @@
+from typing import Annotated
+
+import pandas as pd
+import shap
 from sklearn.base import ClassifierMixin
 from zenml import get_step_context, log_artifact_metadata
-import shap
-import pandas as pd
-from typing import Annotated
 from zenml.steps import step
+
 from .shap_visualization import SHAPVisualization
 
+
 @step
 def explain_model(
-    X_train: pd.DataFrame
+    X_train: pd.DataFrame,
 ) -> Annotated[SHAPVisualization, "shap_visualization"]:
     """Generate SHAP values for model explainability and create a visualization."""
     model = get_step_context().model
     model_artifact: ClassifierMixin = model.load_artifact("model")
-    
-    explainer = shap.KernelExplainer(model_artifact.predict_proba, shap.sample(X_train, 100))
+
+    explainer = shap.KernelExplainer(
+        model_artifact.predict_proba, shap.sample(X_train, 100)
+    )
     shap_values = explainer.shap_values(X_train.iloc[:100])
 
     log_artifact_metadata(
@@ -25,7 +30,7 @@ def explain_model(
                 "n_classes": len(shap_values),
                 "n_features": shap_values[0].shape[1],
             }
-        }
+        },
     )
 
-    return SHAPVisualization(shap_values, X_train.columns)
+    return SHAPVisualization(shap_values, X_train.columns)
diff --git a/databricks-production-qa-demo/steps/explainability/shap_visualization.py b/databricks-production-qa-demo/steps/explainability/shap_visualization.py
@@ -1,14 +1,14 @@
-import os
 import io
+import os
 from typing import Dict
 
-import shap
 import matplotlib.pyplot as plt
-
+import shap
 from zenml.enums import ArtifactType, VisualizationType
 from zenml.io import fileio
 from zenml.materializers.base_materializer import BaseMaterializer
 
+
 # Custom class to hold SHAP visualization data
 class SHAPVisualization:
     def __init__(self, shap_values, feature_names):
@@ -22,18 +22,23 @@ class SHAPVisualizationMaterializer(BaseMaterializer):
     ASSOCIATED_ARTIFACT_TYPE = ArtifactType.DATA_ANALYSIS
 
     def save_visualizations(
-            self, data: SHAPVisualization
+        self, data: SHAPVisualization
     ) -> Dict[str, VisualizationType]:
         plt.figure(figsize=(10, 6))
-        shap.summary_plot(data.shap_values, feature_names=data.feature_names, plot_type="bar", show=False)
+        shap.summary_plot(
+            data.shap_values,
+            feature_names=data.feature_names,
+            plot_type="bar",
+            show=False,
+        )
         plt.title("SHAP Feature Importance")
 
         buf = io.BytesIO()
-        plt.savefig(buf, format='png', dpi=150, bbox_inches='tight')
+        plt.savefig(buf, format="png", dpi=150, bbox_inches="tight")
         buf.seek(0)
 
         visualization_path = os.path.join(self.uri, "shap_summary_plot.png")
-        with fileio.open(visualization_path, 'wb') as f:
+        with fileio.open(visualization_path, "wb") as f:
             f.write(buf.getvalue())
 
         plt.close()
diff --git a/databricks-production-qa-demo/steps/training/model_evaluator.py b/databricks-production-qa-demo/steps/training/model_evaluator.py
@@ -3,7 +3,7 @@
 from PIL import Image, ImageDraw, ImageFont
 from sklearn.base import ClassifierMixin
 from typing_extensions import Annotated
-from zenml import step, get_step_context, log_metadata
+from zenml import get_step_context, log_metadata, step
 from zenml.client import Client
 from zenml.logger import get_logger
 
@@ -31,8 +31,8 @@ def model_evaluator(
         dataset_tst.drop(columns=[target]), dataset_tst[target]
     )
 
-    logger.info(f"Train accuracy={trn_acc*100:.2f}%")
-    logger.info(f"Test accuracy={tst_acc*100:.2f}%")
+    logger.info(f"Train accuracy={trn_acc * 100:.2f}%")
+    logger.info(f"Test accuracy={tst_acc * 100:.2f}%")
     mlflow.log_metric("testing_accuracy_score", tst_acc)
 
     step_context = get_step_context()
@@ -44,7 +44,7 @@ def model_evaluator(
                 "test_accuracy": tst_acc,
             }
         },
-        infer_model=True
+        infer_model=True,
     )
 
     # Fetch previous versions (same as before)
@@ -55,7 +55,9 @@ def model_evaluator(
             step_context.model.name, version.version
         )
         if "evaluation_metrics" in version_obj.run_metadata:
-            test_accuracy = version_obj.run_metadata["evaluation_metrics"].get("test_accuracy")
+            test_accuracy = version_obj.run_metadata["evaluation_metrics"].get(
+                "test_accuracy"
+            )
             if test_accuracy is not None:
                 previous_versions.append(
                     (f"v{version.version}", float(test_accuracy))
diff --git a/databricks-production-qa-demo/steps/training/model_trainer.py b/databricks-production-qa-demo/steps/training/model_trainer.py
@@ -50,7 +50,8 @@ def model_trainer(
     target: str,
     name: str,
 ) -> Annotated[
-    ClassifierMixin, ArtifactConfig(name="model", artifact_type=ArtifactType.MODEL)
+    ClassifierMixin,
+    ArtifactConfig(name="model", artifact_type=ArtifactType.MODEL),
 ]:
     """Configure and train a model on the training dataset.
 
diff --git a/end-to-end-computer-vision/steps/export_label_studio.py b/end-to-end-computer-vision/steps/export_label_studio.py
@@ -16,16 +16,12 @@
 #
 from typing import Annotated, List, Tuple
 
-from zenml import log_metadata, step
-from zenml.client import Client
-from zenml.logger import get_logger
-
 from materializers.label_studio_export_materializer import (
     LabelStudioAnnotationExport,
     LabelStudioAnnotationMaterializer,
 )
 from utils.constants import LABELED_DATASET_NAME
-from zenml import log_artifact_metadata, step
+from zenml import log_metadata, step
 from zenml.client import Client
 from zenml.logger import get_logger
 
diff --git a/end-to-end-computer-vision/steps/fiftyone_inference.py b/end-to-end-computer-vision/steps/fiftyone_inference.py
@@ -18,17 +18,12 @@
 from typing import Annotated
 
 import fiftyone as fo
-from zenml import log_metadata, step
-from zenml.client import Client
-from zenml.io import fileio
-from zenml.logger import get_logger
-
 from utils.constants import (
     DATASET_NAME,
     PREDICTIONS_DATASET_ARTIFACT_NAME,
     TRAINED_MODEL_NAME,
 )
-from zenml import log_artifact_metadata, step
+from zenml import log_metadata, step
 from zenml.client import Client
 from zenml.io import fileio
 from zenml.logger import get_logger
diff --git a/end-to-end-computer-vision/steps/load_model.py b/end-to-end-computer-vision/steps/load_model.py
@@ -27,7 +27,9 @@
 @step(enable_cache=True, enable_step_logs=False)
 def load_model(
     model_checkpoint: str,
-) -> Annotated[YOLO, ArtifactConfig(name="Raw_YOLO", artifact_type=ArtifactType.MODEL)]:
+) -> Annotated[
+    YOLO, ArtifactConfig(name="Raw_YOLO", artifact_type=ArtifactType.MODEL)
+]:
     """Loads a YOLO model from a checkpoint.
 
     Args:
diff --git a/end-to-end-computer-vision/steps/train_model.py b/end-to-end-computer-vision/steps/train_model.py
@@ -16,17 +16,16 @@
 
 from typing import Annotated, Any, Dict, Tuple
 
-from ultralytics import YOLO
-from zenml import ArtifactConfig, log_metadata, step
-from zenml.logger import get_logger
-
 from materializers.label_studio_export_materializer import (
     LabelStudioAnnotationExport,
 )
 from materializers.ultralytics_materializer import UltralyticsMaterializer
 from ultralytics import YOLO
 from utils.dataset_utils import load_and_split_data
+from zenml import ArtifactConfig, log_metadata, step
 from zenml.enums import ArtifactType
+from zenml.logger import get_logger
+
 logger = get_logger(__name__)
 
 
@@ -46,7 +45,8 @@ def train_model(
     is_apple_silicon_env: bool = False,
 ) -> Tuple[
     Annotated[
-        YOLO, ArtifactConfig(name="Trained_YOLO", artifact_type=ArtifactType.MODEL)
+        YOLO,
+        ArtifactConfig(name="Trained_YOLO", artifact_type=ArtifactType.MODEL),
     ],
     Annotated[Dict[str, Any], "validation_metrics"],
     Annotated[Dict[str, Any], "model_names"],
@@ -107,7 +107,7 @@ def train_model(
 
     logger.info("Evaluating model...")
     metrics = model.val()  # evaluate model performance on the validation set
-    
+
     log_metadata(
         artifact_name="Trained_YOLO",
         infer_artifact=True,
diff --git a/flux-dreambooth/k8s_run.py b/flux-dreambooth/k8s_run.py
@@ -326,13 +326,11 @@ def generate_video_frames(
     settings={"orchestrator.kubernetes": kubernetes_settings},
     enable_cache=False,
 )
-def image_to_video() -> (
-    Tuple[
-        Annotated[PILImage.Image, "generated_image"],
-        Annotated[bytes, "video_data"],
-        Annotated[HTMLString, "video_html"],
-    ]
-):
+def image_to_video() -> Tuple[
+    Annotated[PILImage.Image, "generated_image"],
+    Annotated[bytes, "video_data"],
+    Annotated[HTMLString, "video_html"],
+]:
     model_path = f"{TrainConfig().hf_username}/{TrainConfig().hf_repo_suffix}"
 
     pipe = AutoPipelineForText2Image.from_pretrained(
diff --git a/flux-dreambooth/modal_run.py b/flux-dreambooth/modal_run.py
@@ -308,13 +308,11 @@ def generate_video_frames(
     settings={"step_operator.modal": modal_settings},
     enable_cache=False,
 )
-def image_to_video() -> (
-    Tuple[
-        Annotated[PILImage.Image, "generated_image"],
-        Annotated[bytes, "video_data"],
-        Annotated[HTMLString, "video_html"],
-    ]
-):
+def image_to_video() -> Tuple[
+    Annotated[PILImage.Image, "generated_image"],
+    Annotated[bytes, "video_data"],
+    Annotated[HTMLString, "video_html"],
+]:
     model_path = f"{TrainConfig().hf_username}/{TrainConfig().hf_repo_suffix}"
 
     pipe = AutoPipelineForText2Image.from_pretrained(
diff --git a/flux-dreambooth/modal_run_using_azure_data.py b/flux-dreambooth/modal_run_using_azure_data.py
@@ -300,13 +300,11 @@ def generate_video_frames(
     settings={"step_operator.modal": modal_settings},
     enable_cache=False,
 )
-def image_to_video() -> (
-    Tuple[
-        Annotated[PILImage.Image, "generated_image"],
-        Annotated[bytes, "video_data"],
-        Annotated[HTMLString, "video_html"],
-    ]
-):
+def image_to_video() -> Tuple[
+    Annotated[PILImage.Image, "generated_image"],
+    Annotated[bytes, "video_data"],
+    Annotated[HTMLString, "video_html"],
+]:
     model_path = f"{TrainConfig().hf_username}/{TrainConfig().hf_repo_suffix}"
 
     pipe = AutoPipelineForText2Image.from_pretrained(
diff --git a/flux-dreambooth/train_dreambooth_lora_flux.py b/flux-dreambooth/train_dreambooth_lora_flux.py
@@ -1430,7 +1430,7 @@ def load_model_hook(models, input_dir):
         lora_state_dict = FluxPipeline.lora_state_dict(input_dir)
 
         transformer_state_dict = {
-            f'{k.replace("transformer.", "")}': v
+            f"{k.replace('transformer.', '')}": v
             for k, v in lora_state_dict.items()
             if k.startswith("transformer.")
         }
diff --git a/huggingface-sagemaker/steps/deploying/huggingface_deployment.py b/huggingface-sagemaker/steps/deploying/huggingface_deployment.py
@@ -47,7 +47,9 @@ def deploy_to_huggingface(
     save_model_to_deploy.entrypoint()
 
     logger.info("Model saved locally. Pushing to HuggingFace...")
-    assert secret, "No secret found with name 'huggingface_creds'. Please create one with your `token`."
+    assert secret, (
+        "No secret found with name 'huggingface_creds'. Please create one with your `token`."
+    )
 
     token = secret.secret_values["token"]
     api = HfApi(token=token)
diff --git a/huggingface-sagemaker/steps/promotion/promote_get_metrics.py b/huggingface-sagemaker/steps/promotion/promote_get_metrics.py
@@ -27,12 +27,10 @@
 
 
 @step
-def promote_get_metrics() -> (
-    Tuple[
-        Annotated[Dict[str, Any], "latest_metrics"],
-        Annotated[Dict[str, Any], "current_metrics"],
-    ]
-):
+def promote_get_metrics() -> Tuple[
+    Annotated[Dict[str, Any], "latest_metrics"],
+    Annotated[Dict[str, Any], "current_metrics"],
+]:
     """Get metrics for comparison for promoting a model.
 
     This is an example of a metric retrieval step. It is used to retrieve
diff --git a/huggingface-sagemaker/steps/training/model_trainer.py b/huggingface-sagemaker/steps/training/model_trainer.py
@@ -29,9 +29,9 @@
 )
 from typing_extensions import Annotated
 from utils.misc import compute_metrics
-from zenml.enums import ArtifactType
 from zenml import ArtifactConfig, log_artifact_metadata, step
 from zenml.client import Client
+from zenml.enums import ArtifactType
 from zenml.integrations.mlflow.experiment_trackers import (
     MLFlowExperimentTracker,
 )
@@ -66,7 +66,8 @@ def model_trainer(
     weight_decay: Optional[float] = 0.01,
 ) -> Tuple[
     Annotated[
-        PreTrainedModel, ArtifactConfig(name="model", artifact_type=ArtifactType.MODEL)
+        PreTrainedModel,
+        ArtifactConfig(name="model", artifact_type=ArtifactType.MODEL),
     ],
     Annotated[
         PreTrainedTokenizerBase,
diff --git a/llm-complete-guide/steps/finetune_embeddings.py b/llm-complete-guide/steps/finetune_embeddings.py
@@ -51,7 +51,7 @@
 from zenml.client import Client
 from zenml.enums import ArtifactType
 from zenml.utils.cuda_utils import cleanup_gpu_memory
-from zenml.enums import ArtifactType
+
 
 @step
 def prepare_load_data(
diff --git a/llm-lora-finetuning/steps/finetune.py b/llm-lora-finetuning/steps/finetune.py
diff --git a/llm-lora-finetuning/steps/promote.py b/llm-lora-finetuning/steps/promote.py
diff --git a/sign-language-detection-yolov5/pipelines/deployment_pipeline.py b/sign-language-detection-yolov5/pipelines/deployment_pipeline.py
diff --git a/sign-language-detection-yolov5/pipelines/inference_pipeline.py b/sign-language-detection-yolov5/pipelines/inference_pipeline.py
diff --git a/sign-language-detection-yolov5/pipelines/train_pipeline.py b/sign-language-detection-yolov5/pipelines/train_pipeline.py
diff --git a/sign-language-detection-yolov5/run.py b/sign-language-detection-yolov5/run.py
diff --git a/sign-language-detection-yolov5/steps/detector.py b/sign-language-detection-yolov5/steps/detector.py
diff --git a/sign-language-detection-yolov5/steps/inference_loader.py b/sign-language-detection-yolov5/steps/inference_loader.py
diff --git a/sign-language-detection-yolov5/steps/model_loader.py b/sign-language-detection-yolov5/steps/model_loader.py

Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-from .shap_explainer import explain_model`
	`1`	`+from .shap_explainer import explain_model`