[App] Fixing race condition while setting servers to be free for next batch in the Loadbalancer (#16279)

Sherin Thomas · web-flow · commit d21e81ff186b · 2023-01-06T17:55:33.000-05:00
rece condition fix when setting server to be free for next request
diff --git a/src/lightning_app/components/serve/auto_scaler.py b/src/lightning_app/components/serve/auto_scaler.py
@@ -188,12 +188,6 @@ async def send_batch(self, batch: List[Tuple[str, _BatchRequestModel]], server_u
                     timeout=self._timeout_inference_request,
                     headers=headers,
                 ) as response:
-                    # resetting the server status so other requests can be
-                    # scheduled on this node
-                    if server_url in self._server_status:
-                        # TODO - if the server returns an error, track that so
-                        #  we don't send more requests to it
-                        self._server_status[server_url] = True
                     if response.status == 408:
                         raise HTTPException(408, "Request timed out")
                     response.raise_for_status()
@@ -207,7 +201,12 @@ async def send_batch(self, batch: List[Tuple[str, _BatchRequestModel]], server_u
             result = {request[0]: ex for request in batch}
             self._responses.update(result)
         finally:
-            self._server_status[server_url] = True
+            # resetting the server status so other requests can be
+            # scheduled on this node
+            if server_url in self._server_status:
+                # TODO - if the server returns an error, track that so
+                #  we don't send more requests to it
+                self._server_status[server_url] = True
 
     def _find_free_server(self) -> Optional[str]:
         existing = set(self._server_status.keys())