adopt jacky's suggestion

ziqifan617 · ziqifan617 · commit 8f65350f82d4 · 2025-02-05T16:44:37.000-08:00
diff --git a/qa/L0_backend_python/parameters/response_parameters_test.py b/qa/L0_backend_python/parameters/response_parameters_test.py
@@ -169,15 +169,28 @@ def test_setting_response_parameters_decoupled(self):
 
     def test_setting_response_parameters_bls_decoupled(self):
         model_name = "response_parameters_bls_decoupled"
-        params = [{"bool": False, "int": 2048}, {"str": "Hello World!"}]
+        params = {"bool": False, "int": 2048, "str": "Hello World!"}
+        params_decoupled = [{}, {"bool": True, "int": 10000}, {"str": "?"}]
         params_str = json.dumps(params)
-
-        inputs = [grpcclient.InferInput("RESPONSE_PARAMETERS", self._shape, "BYTES")]
+        params_decoupled_str = json.dumps(params_decoupled)
+
+        inputs = [
+            grpcclient.InferInput("RESPONSE_PARAMETERS", self._shape, "BYTES"),
+            grpcclient.InferInput(
+                "RESPONSE_PARAMETERS_DECOUPLED", self._shape, "BYTES"
+            ),
+        ]
         inputs[0].set_data_from_numpy(np.array([[params_str]], dtype=np.object_))
+        inputs[1].set_data_from_numpy(
+            np.array([[params_decoupled_str]], dtype=np.object_)
+        )
 
         with self._shm_leak_detector.Probe() as shm_probe:
             with grpcclient.InferenceServerClient(self._server_address_grpc) as client:
-                client.infer(model_name, inputs)
+                result = client.infer(model_name, inputs)
+
+        output = str(result.as_numpy("OUTPUT")[0][0], encoding="utf-8")
+        self.assertEqual(output, "True")
 
 
 if __name__ == "__main__":
diff --git a/qa/L0_backend_python/parameters/test.sh b/qa/L0_backend_python/parameters/test.sh
@@ -47,7 +47,6 @@ mkdir -p models/response_parameters_bls_decoupled/1 && \
     cp ../../python_models/response_parameters_bls_decoupled/config.pbtxt models/response_parameters_bls_decoupled
 
 TEST_LOG="response_parameters_test.log"
-TEST_BLS_LOG="response_parameters_bls_test.log"
 SERVER_LOG="response_parameters_test.server.log"
 SERVER_ARGS="--model-repository=${MODELDIR}/parameters/models --backend-directory=${BACKEND_DIR} --log-verbose=1"
 
@@ -59,19 +58,12 @@ if [ "$SERVER_PID" == "0" ]; then
 fi
 
 set +e
-MODEL_NAME=response_parameters python3 -m pytest --junitxml=response_parameters_test.report.xml response_parameters_test.py > $TEST_LOG 2>&1
+python3 -m pytest --junitxml=response_parameters_test.report.xml response_parameters_test.py > $TEST_LOG 2>&1
 if [ $? -ne 0 ]; then
     echo -e "\n***\n*** Response parameters test FAILED\n***"
     cat $TEST_LOG
     RET=1
 fi
-
-MODEL_NAME=response_parameters_bls python3 -m pytest -s --junitxml=response_parameters_bls_test.report.xml response_parameters_test.py > $TEST_BLS_LOG 2>&1
-if [ $? -ne 0 ]; then
-    echo -e "\n***\n*** Response parameters BLS test FAILED\n***"
-    cat $TEST_BLS_LOG
-    RET=1
-fi
 set -e
 
 kill $SERVER_PID
diff --git a/qa/python_models/response_parameters_bls/config.pbtxt b/qa/python_models/response_parameters_bls/config.pbtxt
@@ -33,6 +33,11 @@ input [
     name: "RESPONSE_PARAMETERS"
     data_type: TYPE_STRING
     dims: [ 1 ]
+  },
+  {
+    name: "RESPONSE_PARAMETERS_DECOUPLED"
+    data_type: TYPE_STRING
+    dims: [ 1 ]
   }
 ]
 
diff --git a/qa/python_models/response_parameters_bls/model.py b/qa/python_models/response_parameters_bls/model.py
@@ -26,6 +26,7 @@
 
 import json
 
+import numpy as np
 import triton_python_backend_utils as pb_utils
 
 
@@ -45,37 +46,57 @@ def execute(self, requests):
         responses = []
 
         for request in requests:
-            bls_input_tensor = pb_utils.get_input_tensor_by_name(
+            passed = True
+
+            # test bls response parameters from a regular model
+            res_params_tensor = pb_utils.get_input_tensor_by_name(
                 request, "RESPONSE_PARAMETERS"
-            )
-            bls_request = pb_utils.InferenceRequest(
+            ).as_numpy()
+            res_params_str = str(res_params_tensor[0][0], encoding="utf-8")
+            res_params = json.loads(res_params_str)
+            bls_input_tensor = pb_utils.Tensor("RESPONSE_PARAMETERS", res_params_tensor)
+            bls_req = pb_utils.InferenceRequest(
                 model_name="response_parameters",
                 inputs=[bls_input_tensor],
-                requested_output_names=["OUTPUT"],
             )
-            try:
-                bls_response = bls_request.exec()
-                response_tensors = bls_response.output_tensors()
-                response_parameters_str = bls_response.parameters()
-                if bls_response.has_error():
-                    raise Exception(bls_response.error().message())
-                res_params = json.loads(response_parameters_str)
-
-                response = pb_utils.InferenceResponse(
-                    output_tensors=response_tensors, parameters=res_params
-                )
+            bls_res = bls_req.exec()  # decoupled=False
+            bls_res_params_str = bls_res.parameters()
+            bls_res_params = (
+                json.loads(bls_res_params_str) if bls_res_params_str != "" else {}
+            )
+            passed = passed and bls_res_params == res_params
 
-                res_params_set = {}
-                if response.parameters() != "":
-                    res_params_set = json.loads(response.parameters())
-                if res_params_set != res_params:
-                    raise Exception("Response parameters set differ from provided")
-            except Exception as e:
-                error = pb_utils.TritonError(
-                    message=str(e), code=pb_utils.TritonError.INVALID_ARG
+            # test bls response parameters from a decoupled model
+            res_params_decoupled_tensor = pb_utils.get_input_tensor_by_name(
+                request, "RESPONSE_PARAMETERS_DECOUPLED"
+            ).as_numpy()
+            res_params_decoupled_str = str(
+                res_params_decoupled_tensor[0][0], encoding="utf-8"
+            )
+            res_params_decoupled = json.loads(res_params_decoupled_str)
+            bls_decoupled_input_tensor = pb_utils.Tensor(
+                "RESPONSE_PARAMETERS_DECOUPLED", res_params_decoupled_tensor
+            )
+            bls_decoupled_req = pb_utils.InferenceRequest(
+                model_name="response_parameters_decoupled",
+                inputs=[bls_decoupled_input_tensor],
+            )
+            bls_decoupled_res = bls_decoupled_req.exec(decoupled=True)
+            for bls_decoupled_r in bls_decoupled_res:
+                bls_decoupled_r_params_str = bls_decoupled_r.parameters()
+                bls_decoupled_r_params = (
+                    json.loads(bls_decoupled_r_params_str)
+                    if bls_decoupled_r_params_str != ""
+                    else {}
                 )
-                response = pb_utils.InferenceResponse(error=error)
+                passed = passed and bls_decoupled_r_params in res_params_decoupled
+                res_params_decoupled.remove(bls_decoupled_r_params)
+            passed = passed and len(res_params_decoupled) == 0
 
+            output_tensor = pb_utils.Tensor(
+                "OUTPUT", np.array([[str(passed)]], dtype=np.object_)
+            )
+            response = pb_utils.InferenceResponse(output_tensors=[output_tensor])
             responses.append(response)
 
         return responses
diff --git a/qa/python_models/response_parameters_bls_decoupled/config.pbtxt b/qa/python_models/response_parameters_bls_decoupled/config.pbtxt
diff --git a/qa/python_models/response_parameters_bls_decoupled/model.py b/qa/python_models/response_parameters_bls_decoupled/model.py

Original file line number	Diff line number	Diff line change
`@@ -33,6 +33,11 @@ input [`
`33`	`33`	`name: "RESPONSE_PARAMETERS"`
`34`	`34`	`data_type: TYPE_STRING`
`35`	`35`	`dims: [ 1 ]`
	`36`	`+ },`
	`37`	`+ {`
	`38`	`+ name: "RESPONSE_PARAMETERS_DECOUPLED"`
	`39`	`+ data_type: TYPE_STRING`
	`40`	`+ dims: [ 1 ]`
`36`	`41`	`}`
`37`	`42`	`]`
`38`	`43`