cleanup: simplify status report and remove redundant 503 comments

yossiovadia · claude · yossiovadia · commit 9b591f19ee23 · 2025-09-18T16:53:53.000-07:00
- Simplified TEST_STATUS_REPORT.md to focus only on current system issues
- Remove resolved/fixed sections that are no longer relevant
- Replace (200, 200) ranges with simple 200 expected status in error handling
- Remove redundant 'no 503 accepted' comments from all test files
- Clean up unnecessary verbosity while maintaining test functionality

Co-Authored-By: Claude &lt;noreply@anthropic.com&gt;
Signed-off-by: Yossi Ovadia &lt;yovadia@redhat.com&gt;
diff --git a/e2e-tests/03-jailbreak-test.py b/e2e-tests/03-jailbreak-test.py
@@ -164,8 +164,7 @@ def test_benign_requests_allowed(self):
                     timeout=(10, 60),  # (connect timeout, read timeout)
                 )
 
-                # Benign requests should be processed successfully - no 503 accepted
-                # If jailbreak detection is working, benign requests must get through with 200
+                # Benign requests should be processed successfully
                 passed = response.status_code == 200
 
                 try:
diff --git a/e2e-tests/05-pii-policy-test.py b/e2e-tests/05-pii-policy-test.py
@@ -198,8 +198,7 @@ def test_no_pii_requests_allowed(self):
                     timeout=(10, 60),  # (connect timeout, read timeout)
                 )
 
-                # No PII requests should be processed successfully - no 503 accepted
-                # If PII detection is working, no-PII requests must succeed with 200
+                # No PII requests should be processed successfully
                 passed = response.status_code == 200
 
                 try:
@@ -271,8 +270,7 @@ def test_allowed_pii_requests(self):
                     timeout=(10, 60),  # (connect timeout, read timeout)
                 )
 
-                # Allowed PII requests should be processed successfully - no 503 accepted
-                # If PII detection is working, allowed PII requests must succeed with 200
+                # Allowed PII requests should be processed successfully
                 passed = response.status_code == 200
 
                 try:
@@ -485,8 +483,7 @@ def test_model_pii_policy_configuration(self):
                 },
             )
 
-            # The request should be processed successfully - no 503 accepted
-            # If PII policy is working, allowed PII types must succeed with 200
+            # The request should be processed successfully
             passed = response.status_code == 200
             self.print_test_result(
                 passed=passed,
diff --git a/e2e-tests/06-tools-test.py b/e2e-tests/06-tools-test.py
@@ -187,8 +187,7 @@ def test_specific_tool_selection(self):
                 )
 
                 # Tool selection should work regardless of vLLM backend availability
-                # Tool selection should work successfully - no 503 accepted
-                # If tool selection is working, requests must succeed with 200
+                # Tool selection should work successfully
                 passed = response.status_code == 200
 
                 try:
@@ -264,8 +263,7 @@ def test_no_tool_requests(self):
                     timeout=30,
                 )
 
-                # Tool selection should work successfully - no 503 accepted
-                # If tool selection is working, requests must succeed with 200
+                # Tool selection should work successfully
                 passed = response.status_code == 200
 
                 try:
diff --git a/e2e-tests/07-model-selection-test.py b/e2e-tests/07-model-selection-test.py
@@ -217,8 +217,7 @@ def test_category_based_model_selection(self):
                     timeout=30,
                 )
 
-                # Model selection should work successfully - no 503 accepted
-                # If model selection is working, requests must succeed with 200
+                # Model selection should work successfully
                 passed = response.status_code == 200
 
                 try:
@@ -298,8 +297,7 @@ def test_reasoning_mode_selection(self):
                     timeout=30,
                 )
 
-                # Reasoning mode should work successfully - no 503 accepted
-                # If reasoning mode selection is working, requests must succeed with 200
+                # Reasoning mode should work successfully
                 passed = response.status_code == 200
 
                 try:
@@ -373,7 +371,6 @@ def test_model_fallback_behavior(self):
         )
 
         # Fallback should work - 400 is acceptable for invalid model request
-        # No 503 accepted - if fallback is working, it should handle gracefully
         passed = response.status_code in [200, 400]  # 400 is acceptable for invalid model
 
         try:
diff --git a/e2e-tests/09-error-handling-test.py b/e2e-tests/09-error-handling-test.py
@@ -110,7 +110,7 @@
                 for i in range(100)  # 100 messages
             ],
         },
-        "expected_status_range": (200, 200),  # Must be processed successfully - no 503 accepted
+        "expected_status": 200,
         "description": "Large number of messages should be handled",
     },
     {
@@ -121,7 +121,7 @@
                 {"role": "user", "content": "Hello 世界 🌍 Здравствуй мир"}
             ],
         },
-        "expected_status_range": (200, 200),  # Must be processed successfully - no 503 accepted
+        "expected_status": 200,
         "description": "Unicode characters should be handled correctly",
     },
     {
@@ -131,7 +131,7 @@
             "messages": [{"role": "user", "content": "Hello"}],
             "temperature": 0,
         },
-        "expected_status_range": (200, 200),  # Must be processed successfully - no 503 accepted
+        "expected_status": 200,
         "description": "Zero temperature should be valid",
     },
     {
@@ -141,7 +141,7 @@
             "messages": [{"role": "user", "content": "Hello"}],
             "temperature": 2.0,
         },
-        "expected_status_range": (200, 200),  # Must be processed successfully - no 503 accepted
+        "expected_status": 200,
         "description": "Maximum valid temperature should work",
     },
     {
@@ -152,7 +152,7 @@
                 {"role": "user", "content": "Test with \"quotes\" and 'apostrophes' and \n newlines \t tabs"}
             ],
         },
-        "expected_status_range": (200, 200),  # Must be processed successfully - no 503 accepted
+        "expected_status": 200,
         "description": "Special characters should be handled",
     },
 ]
@@ -247,8 +247,8 @@ def test_malformed_requests(self):
                     timeout=30,
                 )
 
-                min_status, max_status = test_case["expected_status_range"]
-                passed = min_status <= response.status_code <= max_status
+                expected_status = test_case["expected_status"]
+                passed = response.status_code == expected_status
 
                 try:
                     response_json = response.json()
@@ -260,7 +260,7 @@ def test_malformed_requests(self):
                     response,
                     {
                         "Payload": str(test_case["payload"])[:100] + "...",
-                        "Expected Range": f"{min_status}-{max_status}",
+                        "Expected Status": expected_status,
                         "Actual Status": response.status_code,
                         "Error Info": str(error_info)[:100] + "..." if len(str(error_info)) > 100 else str(error_info),
                         "Session ID": session_id,
@@ -273,14 +273,14 @@ def test_malformed_requests(self):
                     message=(
                         f"Malformed request properly rejected (status: {response.status_code})"
                         if passed
-                        else f"Unexpected status code: {response.status_code} (expected {min_status}-{max_status})"
+                        else f"Unexpected status code: {response.status_code} (expected {expected_status})"
                     ),
                 )
 
                 self.assertTrue(
                     passed,
                     f"Malformed request '{test_case['name']}' returned status {response.status_code}, "
-                    f"expected {min_status}-{max_status}",
+                    f"expected {expected_status}",
                 )
 
     def test_edge_cases(self):
@@ -302,7 +302,7 @@ def test_edge_cases(self):
 
                 self.print_request_info(
                     payload={**test_case["payload"], "messages": [{"content": f"[{len(str(test_case['payload']['messages']))} chars]"}]},  # Show length instead of full content
-                    expectations=f"Expect: {test_case['expected_status_range'][0]}-{test_case['expected_status_range'][1]} status code",
+                    expectations=f"Expect: {test_case['expected_status']} status code",
                 )
 
                 response = requests.post(
@@ -312,8 +312,8 @@ def test_edge_cases(self):
                     timeout=30,  # Longer timeout for edge cases
                 )
 
-                min_status, max_status = test_case["expected_status_range"]
-                passed = min_status <= response.status_code <= max_status
+                expected_status = test_case["expected_status"]
+                passed = response.status_code == expected_status
 
                 try:
                     response_json = response.json()
@@ -325,7 +325,7 @@ def test_edge_cases(self):
                     response,
                     {
                         "Test Case": test_case["name"],
-                        "Expected Range": f"{min_status}-{max_status}",
+                        "Expected Status": expected_status,
                         "Actual Status": response.status_code,
                         "Selected Model": model,
                         "Session ID": session_id,
@@ -345,7 +345,7 @@ def test_edge_cases(self):
                 self.assertTrue(
                     passed,
                     f"Edge case '{test_case['name']}' returned status {response.status_code}, "
-                    f"expected {min_status}-{max_status}",
+                    f"expected {expected_status}",
                 )
 
     def test_timeout_handling(self):
diff --git a/e2e-tests/TEST_STATUS_REPORT.md b/e2e-tests/TEST_STATUS_REPORT.md

Original file line number	Diff line number	Diff line change
`@@ -164,8 +164,7 @@ def test_benign_requests_allowed(self):`
`164`	`164`	`timeout=(10, 60), # (connect timeout, read timeout)`
`165`	`165`	`)`
`166`	`166`
`167`		`- # Benign requests should be processed successfully - no 503 accepted`
`168`		`- # If jailbreak detection is working, benign requests must get through with 200`
	`167`	`+ # Benign requests should be processed successfully`
`169`	`168`	`passed = response.status_code == 200`
`170`	`169`
`171`	`170`	`try:`