Some fixes for endpoints (#283)

yunfeng-scale · web-flow · commit 112f0820cfa5 · 2023-09-18T15:29:53.000-07:00
diff --git a/charts/model-engine/templates/service_template_config_map.yaml b/charts/model-engine/templates/service_template_config_map.yaml
@@ -127,6 +127,7 @@ data:
                   port: ${FORWARDER_PORT}
                 initialDelaySeconds: ${READINESS_INITIAL_DELAY}
                 periodSeconds: 5
+                timeoutSeconds: 5
               resources:
                 requests:
                   cpu: 0.1
@@ -172,6 +173,7 @@ data:
                   port: ${FORWARDER_PORT}
                 initialDelaySeconds: ${READINESS_INITIAL_DELAY}
                 periodSeconds: 5
+                timeoutSeconds: 5
               resources:
                 requests:
                   cpu: 0.1
@@ -285,11 +287,6 @@ data:
                   port: ${USER_CONTAINER_PORT}
                 initialDelaySeconds: ${READINESS_INITIAL_DELAY}
                 periodSeconds: 5
-              livenessProbe:
-                httpGet:
-                  path: ${HEALTHCHECK_ROUTE}
-                  port: ${USER_CONTAINER_PORT}
-                initialDelaySeconds: ${READINESS_INITIAL_DELAY}
                 timeoutSeconds: 5
               resources:
                 requests:
diff --git a/model-engine/model_engine_server/common/resource_limits.py b/model-engine/model_engine_server/common/resource_limits.py
@@ -43,8 +43,8 @@
     GpuType.NVIDIA_AMPERE_A100E: A100_INSTANCE_LIMITS,
 }
 
-FORWARDER_CPU_USAGE = 0.5
-FORWARDER_MEMORY_USAGE = "1Gi"
+FORWARDER_CPU_USAGE = 1
+FORWARDER_MEMORY_USAGE = "2Gi"
 FORWARDER_STORAGE_USAGE = "1G"
 
 logger = make_logger(filename_wo_ext(__name__))
diff --git a/model-engine/model_engine_server/inference/configs/service--http_forwarder.yaml b/model-engine/model_engine_server/inference/configs/service--http_forwarder.yaml
@@ -16,4 +16,4 @@ forwarder:
     batch_route: null
     model_engine_unwrap: true
     serialize_results_as_string: false
-  max_concurrency: 20
+  max_concurrency: 100

Original file line number	Diff line number	Diff line change
`@@ -43,8 +43,8 @@`
`43`	`43`	`GpuType.NVIDIA_AMPERE_A100E: A100_INSTANCE_LIMITS,`
`44`	`44`	`}`
`45`	`45`
`46`		`-FORWARDER_CPU_USAGE = 0.5`
`47`		`-FORWARDER_MEMORY_USAGE = "1Gi"`
	`46`	`+FORWARDER_CPU_USAGE = 1`
	`47`	`+FORWARDER_MEMORY_USAGE = "2Gi"`
`48`	`48`	`FORWARDER_STORAGE_USAGE = "1G"`
`49`	`49`
`50`	`50`	`logger = make_logger(filename_wo_ext(__name__))`