Refactoring

Jonathan Makunga · Jonathan Makunga · commit 0aba49e8996c · 2024-07-10T13:09:07.000-07:00
diff --git a/src/sagemaker/serve/builder/jumpstart_builder.py b/src/sagemaker/serve/builder/jumpstart_builder.py
@@ -783,11 +783,10 @@ def _optimize_for_jumpstart(
                     "AcceptEula": True
                 }
 
-        if quantization_config or is_compilation:
-            optimization_env_vars = _update_environment_variables(
-                optimization_env_vars, override_env
-            )
+        optimization_env_vars = _update_environment_variables(optimization_env_vars, override_env)
+        if optimization_env_vars:
             self.pysdk_model.env.update(optimization_env_vars)
+        if quantization_config or is_compilation:
             return create_optimization_job_args
         return None
 
diff --git a/src/sagemaker/serve/builder/model_builder.py b/src/sagemaker/serve/builder/model_builder.py
@@ -1258,10 +1258,8 @@ def _model_builder_optimize_wrapper(
             )
 
         if input_args:
-            print(input_args)
             self.sagemaker_session.sagemaker_client.create_optimization_job(**input_args)
             job_status = self.sagemaker_session.wait_for_optimization_job(job_name)
-            print(job_status)
             return _generate_optimized_model(self.pysdk_model, job_status)
 
         self.pysdk_model.remove_tag_with_key(Tag.OPTIMIZATION_JOB_NAME)
diff --git a/tests/unit/sagemaker/serve/builder/test_model_builder.py b/tests/unit/sagemaker/serve/builder/test_model_builder.py
@@ -2653,22 +2653,20 @@ def test_optimize_for_hf_with_custom_s3_path(
             model_metadata={
                 "CUSTOM_MODEL_PATH": "s3://bucket/path/",
             },
+            role_arn="role-arn",
+            instance_type="ml.g5.2xlarge",
         )
 
         model_builder.pysdk_model = mock_pysdk_model
 
         out_put = model_builder._optimize_for_hf(
             job_name="job_name-123",
-            instance_type="ml.g5.2xlarge",
-            role_arn="role-arn",
             quantization_config={
                 "OverrideEnvironment": {"OPTION_QUANTIZE": "awq"},
             },
             output_path="s3://bucket/code/",
         )
 
-        print(out_put)
-
         self.assertEqual(model_builder.role_arn, "role-arn")
         self.assertEqual(model_builder.instance_type, "ml.g5.2xlarge")
         self.assertEqual(model_builder.pysdk_model.env["OPTION_QUANTIZE"], "awq")
@@ -2715,14 +2713,14 @@ def test_optimize_for_hf_without_custom_s3_path(
         model_builder = ModelBuilder(
             model="meta-llama/Meta-Llama-3-8B-Instruct",
             env_vars={"HUGGING_FACE_HUB_TOKEN": "token"},
+            role_arn="role-arn",
+            instance_type="ml.g5.2xlarge",
         )
 
         model_builder.pysdk_model = mock_pysdk_model
 
         out_put = model_builder._optimize_for_hf(
             job_name="job_name-123",
-            instance_type="ml.g5.2xlarge",
-            role_arn="role-arn",
             quantization_config={
                 "OverrideEnvironment": {"OPTION_QUANTIZE": "awq"},
             },

Original file line number	Diff line number	Diff line change
`@@ -1258,10 +1258,8 @@ def _model_builder_optimize_wrapper(`
`1258`	`1258`	`)`
`1259`	`1259`
`1260`	`1260`	`if input_args:`
`1261`		`- print(input_args)`
`1262`	`1261`	`self.sagemaker_session.sagemaker_client.create_optimization_job(**input_args)`
`1263`	`1262`	`job_status = self.sagemaker_session.wait_for_optimization_job(job_name)`
`1264`		`- print(job_status)`
`1265`	`1263`	`return _generate_optimized_model(self.pysdk_model, job_status)`
`1266`	`1264`
`1267`	`1265`	`self.pysdk_model.remove_tag_with_key(Tag.OPTIMIZATION_JOB_NAME)`