SonySemiconductorSolutions
diff --git a/‎model_compression_toolkit/gptq/keras/quantization_facade.py‎
Lines changed: 79 additions & 76 deletions b/‎model_compression_toolkit/gptq/keras/quantization_facade.py‎
Lines changed: 79 additions & 76 deletions
diff --git a/‎model_compression_toolkit/gptq/pytorch/quantization_facade.py‎
Lines changed: 79 additions & 77 deletions b/‎model_compression_toolkit/gptq/pytorch/quantization_facade.py‎
Lines changed: 79 additions & 77 deletions
@@ -16,6 +16,7 @@
 
 from typing import Callable, Tuple, Union, Optional
 from packaging import version
+from tqdm.contrib.logging import logging_redirect_tqdm
 
 from model_compression_toolkit.core.common.visualization.tensorboard_writer import init_tensorboard_writer
 from model_compression_toolkit.gptq.common.gptq_constants import REG_DEFAULT, LR_DEFAULT, LR_REST_DEFAULT, \
@@ -232,82 +233,84 @@ def keras_gradient_post_training_quantization(in_model: Model, representative_da
 
         """
 
-        if core_config.debug_config.bypass:
-            return in_model, None
-
-        KerasModelValidation(model=in_model,
-                             fw_info=DEFAULT_KERAS_INFO).validate()
-
-        if core_config.is_mixed_precision_enabled:
-            if not isinstance(core_config.mixed_precision_config, MixedPrecisionQuantizationConfig):
-                Logger.critical("Given quantization config for mixed-precision is not of type 'MixedPrecisionQuantizationConfig'. "
-                                "Ensure usage of the correct API for keras_post_training_quantization "
-                                "or provide a valid mixed-precision configuration.")  # pragma: no cover
-
-        tb_w = init_tensorboard_writer(DEFAULT_KERAS_INFO)
-
-        fw_impl = GPTQKerasImplemantation()
-
-        target_platform_capabilities = load_target_platform_capabilities(target_platform_capabilities)
-        # Attach tpc model to framework
-        attach2keras = AttachTpcToKeras()
-        framework_platform_capabilities = attach2keras.attach(
-            target_platform_capabilities,
-            custom_opset2layer=core_config.quantization_config.custom_tpc_opset_to_layer)
-
-        progress_info_controller = ProgressInfoController(
-            total_step=research_progress_total(core_config, target_resource_utilization, gptq_config),
-            description="MCT Keras GPTQ Progress",
-            progress_info_callback=core_config.debug_config.progress_info_callback
-        )
-
-        tg, bit_widths_config, hessian_info_service, scheduling_info = core_runner(in_model=in_model,
-                                                                                   representative_data_gen=representative_data_gen,
-                                                                                   core_config=core_config,
-                                                                                   fw_info=DEFAULT_KERAS_INFO,
-                                                                                   fw_impl=fw_impl,
-                                                                                   fqc=framework_platform_capabilities,
-                                                                                   target_resource_utilization=target_resource_utilization,
-                                                                                   tb_w=tb_w,
-                                                                                   running_gptq=True,
-                                                                                   progress_info_controller=progress_info_controller)
-
-        float_graph = copy.deepcopy(tg)
-
-        tg_gptq = gptq_runner(tg,
-                              core_config,
-                              gptq_config,
-                              representative_data_gen,
-                              gptq_representative_data_gen if gptq_representative_data_gen else representative_data_gen,
-                              DEFAULT_KERAS_INFO,
-                              fw_impl,
-                              tb_w,
-                              hessian_info_service=hessian_info_service,
-                              progress_info_controller=progress_info_controller)
-
-        del hessian_info_service
-
-        if progress_info_controller is not None:
-            progress_info_controller.set_description("MCT Graph Finalization")
-
-        if core_config.debug_config.analyze_similarity:
-            analyzer_model_quantization(representative_data_gen,
-                                        tb_w,
-                                        float_graph,
-                                        tg_gptq,
-                                        fw_impl,
-                                        DEFAULT_KERAS_INFO)
-
-        exportable_model, user_info = get_exportable_keras_model(tg_gptq)
-        if framework_platform_capabilities.tpc.add_metadata:
-            exportable_model = add_metadata(exportable_model,
-                                            create_model_metadata(fqc=framework_platform_capabilities,
-                                                                  scheduling_info=scheduling_info))
-
-        if progress_info_controller is not None:
-            progress_info_controller.close()
-
-        return exportable_model, user_info
+        with logging_redirect_tqdm():
+
+            if core_config.debug_config.bypass:
+                return in_model, None
+
+            KerasModelValidation(model=in_model,
+                                fw_info=DEFAULT_KERAS_INFO).validate()
+
+            if core_config.is_mixed_precision_enabled:
+                if not isinstance(core_config.mixed_precision_config, MixedPrecisionQuantizationConfig):
+                    Logger.critical("Given quantization config for mixed-precision is not of type 'MixedPrecisionQuantizationConfig'. "
+                                    "Ensure usage of the correct API for keras_post_training_quantization "
+                                    "or provide a valid mixed-precision configuration.")  # pragma: no cover
+
+            tb_w = init_tensorboard_writer(DEFAULT_KERAS_INFO)
+
+            fw_impl = GPTQKerasImplemantation()
+
+            target_platform_capabilities = load_target_platform_capabilities(target_platform_capabilities)
+            # Attach tpc model to framework
+            attach2keras = AttachTpcToKeras()
+            framework_platform_capabilities = attach2keras.attach(
+                target_platform_capabilities,
+                custom_opset2layer=core_config.quantization_config.custom_tpc_opset_to_layer)
+
+            progress_info_controller = ProgressInfoController(
+                total_step=research_progress_total(core_config, target_resource_utilization, gptq_config),
+                description="MCT Keras GPTQ Progress",
+                progress_info_callback=core_config.debug_config.progress_info_callback
+            )
+
+            tg, bit_widths_config, hessian_info_service, scheduling_info = core_runner(in_model=in_model,
+                                                                                    representative_data_gen=representative_data_gen,
+                                                                                    core_config=core_config,
+                                                                                    fw_info=DEFAULT_KERAS_INFO,
+                                                                                    fw_impl=fw_impl,
+                                                                                    fqc=framework_platform_capabilities,
+                                                                                    target_resource_utilization=target_resource_utilization,
+                                                                                    tb_w=tb_w,
+                                                                                    running_gptq=True,
+                                                                                    progress_info_controller=progress_info_controller)
+
+            float_graph = copy.deepcopy(tg)
+
+            tg_gptq = gptq_runner(tg,
+                                core_config,
+                                gptq_config,
+                                representative_data_gen,
+                                gptq_representative_data_gen if gptq_representative_data_gen else representative_data_gen,
+                                DEFAULT_KERAS_INFO,
+                                fw_impl,
+                                tb_w,
+                                hessian_info_service=hessian_info_service,
+                                progress_info_controller=progress_info_controller)
+
+            del hessian_info_service
+
+            if progress_info_controller is not None:
+                progress_info_controller.set_description("MCT Graph Finalization")
+
+            if core_config.debug_config.analyze_similarity:
+                analyzer_model_quantization(representative_data_gen,
+                                            tb_w,
+                                            float_graph,
+                                            tg_gptq,
+                                            fw_impl,
+                                            DEFAULT_KERAS_INFO)
+
+            exportable_model, user_info = get_exportable_keras_model(tg_gptq)
+            if framework_platform_capabilities.tpc.add_metadata:
+                exportable_model = add_metadata(exportable_model,
+                                                create_model_metadata(fqc=framework_platform_capabilities,
+                                                                    scheduling_info=scheduling_info))
+
+            if progress_info_controller is not None:
+                progress_info_controller.close()
+
+            return exportable_model, user_info
 
 else:
     # If tensorflow is not installed,
 
@@ -14,6 +14,7 @@
 # ==============================================================================
 import copy
 from typing import Callable, Union, Optional, Tuple
+from tqdm.contrib.logging import logging_redirect_tqdm
 
 from model_compression_toolkit.constants import ACT_HESSIAN_DEFAULT_BATCH_SIZE, GPTQ_HESSIAN_NUM_SAMPLES
 from model_compression_toolkit.core import CoreConfig
@@ -39,7 +40,6 @@
 from model_compression_toolkit.verify_packages import FOUND_TORCH
 
 
-
 if FOUND_TORCH:
     from model_compression_toolkit.core.pytorch.default_framework_info import DEFAULT_PYTORCH_INFO
     from model_compression_toolkit.gptq.pytorch.gptq_pytorch_implementation import GPTQPytorchImplemantation
@@ -209,82 +209,84 @@ def pytorch_gradient_post_training_quantization(model: Module,
 
         """
 
-        if core_config.debug_config.bypass:
-            return model, None
-
-        if core_config.is_mixed_precision_enabled:    # pragma: no cover
-            if not isinstance(core_config.mixed_precision_config, MixedPrecisionQuantizationConfig):
-                Logger.critical("Given quantization config for mixed-precision is not of type 'MixedPrecisionQuantizationConfig'. "
-                                "Ensure usage of the correct API for 'pytorch_gradient_post_training_quantization' "
-                                "or provide a valid mixed-precision configuration.")
-
-        tb_w = init_tensorboard_writer(DEFAULT_PYTORCH_INFO)
-
-        fw_impl = GPTQPytorchImplemantation()
-
-        target_platform_capabilities = load_target_platform_capabilities(target_platform_capabilities)
-        # Attach tpc model to framework
-        attach2pytorch = AttachTpcToPytorch()
-        framework_quantization_capabilities = attach2pytorch.attach(target_platform_capabilities,
-                                                             core_config.quantization_config.custom_tpc_opset_to_layer)
-
-        progress_info_controller = ProgressInfoController(
-            total_step=research_progress_total(core_config, target_resource_utilization, gptq_config),
-            description="MCT PyTorch GPTQ Progress",
-            progress_info_callback=core_config.debug_config.progress_info_callback
-        )
-
-        # ---------------------- #
-        # Core Runner
-        # ---------------------- #
-        graph, bit_widths_config, hessian_info_service, scheduling_info = core_runner(in_model=model,
-                                                                                      representative_data_gen=representative_data_gen,
-                                                                                      core_config=core_config,
-                                                                                      fw_info=DEFAULT_PYTORCH_INFO,
-                                                                                      fw_impl=fw_impl,
-                                                                                      fqc=framework_quantization_capabilities,
-                                                                                      target_resource_utilization=target_resource_utilization,
-                                                                                      tb_w=tb_w,
-                                                                                      running_gptq=True,
-                                                                                      progress_info_controller=progress_info_controller)
-
-        float_graph = copy.deepcopy(graph)
-
-        # ---------------------- #
-        # GPTQ Runner
-        # ---------------------- #
-        graph_gptq = gptq_runner(graph,
-                                 core_config,
-                                 gptq_config,
-                                 representative_data_gen,
-                                 gptq_representative_data_gen if gptq_representative_data_gen else representative_data_gen,
-                                 DEFAULT_PYTORCH_INFO,
-                                 fw_impl,
-                                 tb_w,
-                                 hessian_info_service=hessian_info_service,
-                                 progress_info_controller=progress_info_controller)
-
-        if progress_info_controller is not None:
-            progress_info_controller.set_description("MCT Graph Finalization")
-
-        if core_config.debug_config.analyze_similarity:
-            analyzer_model_quantization(representative_data_gen,
-                                        tb_w,
-                                        float_graph,
-                                        graph_gptq,
-                                        fw_impl,
-                                        DEFAULT_PYTORCH_INFO)
-
-        exportable_model, user_info = get_exportable_pytorch_model(graph_gptq)
-        if framework_quantization_capabilities.tpc.add_metadata:
-            exportable_model = add_metadata(exportable_model,
-                                            create_model_metadata(fqc=framework_quantization_capabilities,
-                                                                  scheduling_info=scheduling_info))
-
-        if progress_info_controller is not None:
-            progress_info_controller.close()
-
-        return exportable_model, user_info
+        with logging_redirect_tqdm():
+
+            if core_config.debug_config.bypass:
+                return model, None
+
+            if core_config.is_mixed_precision_enabled:    # pragma: no cover
+                if not isinstance(core_config.mixed_precision_config, MixedPrecisionQuantizationConfig):
+                    Logger.critical("Given quantization config for mixed-precision is not of type 'MixedPrecisionQuantizationConfig'. "
+                                    "Ensure usage of the correct API for 'pytorch_gradient_post_training_quantization' "
+                                    "or provide a valid mixed-precision configuration.")
+
+            tb_w = init_tensorboard_writer(DEFAULT_PYTORCH_INFO)
+
+            fw_impl = GPTQPytorchImplemantation()
+
+            target_platform_capabilities = load_target_platform_capabilities(target_platform_capabilities)
+            # Attach tpc model to framework
+            attach2pytorch = AttachTpcToPytorch()
+            framework_quantization_capabilities = attach2pytorch.attach(target_platform_capabilities,
+                                                                core_config.quantization_config.custom_tpc_opset_to_layer)
+
+            progress_info_controller = ProgressInfoController(
+                total_step=research_progress_total(core_config, target_resource_utilization, gptq_config),
+                description="MCT PyTorch GPTQ Progress",
+                progress_info_callback=core_config.debug_config.progress_info_callback
+            )
+
+            # ---------------------- #
+            # Core Runner
+            # ---------------------- #
+            graph, bit_widths_config, hessian_info_service, scheduling_info = core_runner(in_model=model,
+                                                                                        representative_data_gen=representative_data_gen,
+                                                                                        core_config=core_config,
+                                                                                        fw_info=DEFAULT_PYTORCH_INFO,
+                                                                                        fw_impl=fw_impl,
+                                                                                        fqc=framework_quantization_capabilities,
+                                                                                        target_resource_utilization=target_resource_utilization,
+                                                                                        tb_w=tb_w,
+                                                                                        running_gptq=True,
+                                                                                        progress_info_controller=progress_info_controller)
+
+            float_graph = copy.deepcopy(graph)
+
+            # ---------------------- #
+            # GPTQ Runner
+            # ---------------------- #
+            graph_gptq = gptq_runner(graph,
+                                    core_config,
+                                    gptq_config,
+                                    representative_data_gen,
+                                    gptq_representative_data_gen if gptq_representative_data_gen else representative_data_gen,
+                                    DEFAULT_PYTORCH_INFO,
+                                    fw_impl,
+                                    tb_w,
+                                    hessian_info_service=hessian_info_service,
+                                    progress_info_controller=progress_info_controller)
+
+            if progress_info_controller is not None:
+                progress_info_controller.set_description("MCT Graph Finalization")
+
+            if core_config.debug_config.analyze_similarity:
+                analyzer_model_quantization(representative_data_gen,
+                                            tb_w,
+                                            float_graph,
+                                            graph_gptq,
+                                            fw_impl,
+                                            DEFAULT_PYTORCH_INFO)
+
+            exportable_model, user_info = get_exportable_pytorch_model(graph_gptq)
+            if framework_quantization_capabilities.tpc.add_metadata:
+                exportable_model = add_metadata(exportable_model,
+                                                create_model_metadata(fqc=framework_quantization_capabilities,
+                                                                    scheduling_info=scheduling_info))
+
+            if progress_info_controller is not None:
+                progress_info_controller.close()
+
+            return exportable_model, user_info
 
 
 else: