Update examples/server-async

FredyRivera-dev · FredyRivera-dev · commit 0beab1cf7841 · 2025-09-10T20:59:05.000-06:00
diff --git a/examples/server-async/DiffusersServer/Pipelines.py b/examples/server-async/DiffusersServer/Pipelines.py
@@ -1,4 +1,4 @@
-# from https://github.com/F4k3r22/DiffusersServer/blob/main/DiffusersServer/Pipelines.py
+# Pipelines.py
 
 from diffusers.pipelines.stable_diffusion_3.pipeline_stable_diffusion_3 import StableDiffusion3Pipeline
 from diffusers.pipelines.flux.pipeline_flux import FluxPipeline
@@ -18,22 +18,12 @@ class TextToImageInput(BaseModel):
 
 class TextToImagePipelineSD3:
     def __init__(self, model_path: str | None = None):
-        """
-        Inicialización de la clase con la ruta del modelo.
-        Si no se proporciona, se obtiene de la variable de entorno.
-        """
         self.model_path = model_path or os.getenv("MODEL_PATH")
         self.pipeline: StableDiffusion3Pipeline = None
         self.device: str = None
 
     def start(self):
-        """
-        Inicia el pipeline cargando el modelo en CUDA o MPS según esté disponible.
-        Se utiliza la ruta del modelo definida en el __init__ y se asigna un valor predeterminado
-        en función del dispositivo disponible si no se definió previamente.
-        """
         if torch.cuda.is_available():
-            # Si no se definió model_path, se asigna el valor por defecto para CUDA.
             model_path = self.model_path or "stabilityai/stable-diffusion-3.5-large"
             logger.info("Loading CUDA")
             self.device = "cuda"
@@ -42,7 +32,6 @@ def start(self):
                 torch_dtype=torch.float16,
             ).to(device=self.device)
         elif torch.backends.mps.is_available():
-            # Si no se definió model_path, se asigna el valor por defecto para MPS.
             model_path = self.model_path or "stabilityai/stable-diffusion-3.5-medium"
             logger.info("Loading MPS for Mac M Series")
             self.device = "mps"
@@ -55,18 +44,13 @@ def start(self):
 
 class TextToImagePipelineFlux:
     def __init__(self, model_path: str | None = None, low_vram: bool = False):
-        """
-        Inicialización de la clase con la ruta del modelo.
-        Si no se proporciona, se obtiene de la variable de entorno.
-        """
         self.model_path = model_path or os.getenv("MODEL_PATH")
         self.pipeline: FluxPipeline = None
         self.device: str = None
         self.low_vram = low_vram
 
     def start(self):
         if torch.cuda.is_available():
-            # Si no se definió model_path, se asigna el valor por defecto para CUDA.
             model_path = self.model_path or "black-forest-labs/FLUX.1-schnell"
             logger.info("Loading CUDA")
             self.device = "cuda" 
@@ -79,7 +63,6 @@ def start(self):
             else:
                 pass
         elif torch.backends.mps.is_available():
-            # Si no se definió model_path, se asigna el valor por defecto para MPS.
             model_path = self.model_path or "black-forest-labs/FLUX.1-schnell"
             logger.info("Loading MPS for Mac M Series")
             self.device = "mps"
@@ -92,17 +75,12 @@ def start(self):
 
 class TextToImagePipelineSD:
     def __init__(self, model_path: str | None = None):
-        """
-        Inicialización de la clase con la ruta del modelo.
-        Si no se proporciona, se obtiene de la variable de entorno.
-        """
         self.model_path = model_path or os.getenv("MODEL_PATH")
         self.pipeline: StableDiffusionPipeline = None
         self.device: str = None
 
     def start(self):
         if torch.cuda.is_available():
-            # Si no se definió model_path, se asigna el valor por defecto para CUDA.
             model_path = self.model_path or "sd-legacy/stable-diffusion-v1-5"
             logger.info("Loading CUDA")
             self.device = "cuda" 
@@ -111,7 +89,6 @@ def start(self):
                 torch_dtype=torch.float16,
             ).to(device=self.device)
         elif torch.backends.mps.is_available():
-            # Si no se definió model_path, se asigna el valor por defecto para MPS.
             model_path = self.model_path or "sd-legacy/stable-diffusion-v1-5"
             logger.info("Loading MPS for Mac M Series")
             self.device = "mps"
diff --git a/examples/server-async/DiffusersServer/create_server.py b/examples/server-async/DiffusersServer/create_server.py
@@ -1,4 +1,4 @@
-# from https://github.com/F4k3r22/DiffusersServer/blob/main/DiffusersServer/create_server.py
+# create_server.py
 
 from .Pipelines import *
 from .serverasync import *
diff --git a/examples/server-async/DiffusersServer/serverasync.py b/examples/server-async/DiffusersServer/serverasync.py
@@ -1,6 +1,4 @@
-# from https://github.com/F4k3r22/DiffusersServer/blob/main/DiffusersServer/serverasync.py
-
-from fastapi import FastAPI, HTTPException, status
+from fastapi import FastAPI, HTTPException, Request
 from fastapi.responses import FileResponse  
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.concurrency import run_in_threadpool
@@ -22,6 +20,8 @@
 from typing import Optional, Dict, Any, Type
 from dataclasses import dataclass, field
 from typing import List
+from contextlib import asynccontextmanager
+import asyncio
 
 @dataclass
 class PresetModels:
@@ -114,19 +114,108 @@ def save_video(self, video, fps):
 
 @dataclass
 class ServerConfigModels:
-    model: str = 'stabilityai/stable-diffusion-3-medium' 
+    model: str = 'stabilityai/stable-diffusion-3-medium'  
     type_models: str = 't2im' 
     custom_model : bool = False
     constructor_pipeline: Optional[Type] = None
-    custom_pipeline: Optional[Type] = None  
+    custom_pipeline: Optional[Type] = None 
     components: Optional[Dict[str, Any]] = None
     api_name: Optional[str] = 'custom_api'
     torch_dtype: Optional[torch.dtype] = None
     host: str = '0.0.0.0' 
     port: int = 8500
 
 def create_app_fastapi(config: ServerConfigModels) -> FastAPI:
-    app = FastAPI()
+
+    server_config = config or ServerConfigModels()
+
+    @asynccontextmanager
+    async def lifespan(app: FastAPI):
+        logging.basicConfig(level=logging.INFO)
+        app.state.logger = logging.getLogger("diffusers-server")
+
+        app.state.total_requests = 0
+        app.state.active_inferences = 0
+        app.state.metrics_lock = asyncio.Lock()
+        app.state.metrics_task = None
+
+        app.state.utils_app = Utils(
+            host=server_config.host,
+            port=server_config.port,
+        )
+
+        async def metrics_loop():
+            try:
+                while True:
+                    async with app.state.metrics_lock:
+                        total = app.state.total_requests
+                        active = app.state.active_inferences
+                    app.state.logger.info(f"[METRICS] total_requests={total} active_inferences={active}")
+                    await asyncio.sleep(5)
+            except asyncio.CancelledError:
+                app.state.logger.info("Metrics loop cancelled")
+                raise
+
+        app.state.metrics_task = asyncio.create_task(metrics_loop())
+
+        try:
+            yield
+        finally:
+            # 🔻 shutdown
+            task = app.state.metrics_task
+            if task:
+                task.cancel()
+                try:
+                    await task
+                except asyncio.CancelledError:
+                    pass
+
+            try:
+                stop_fn = getattr(model_pipeline, "stop", None) or getattr(model_pipeline, "close", None)
+                if callable(stop_fn):
+                    await run_in_threadpool(stop_fn)
+            except Exception as e:
+                app.state.logger.warning(f"Error during pipeline shutdown: {e}")
+
+            app.state.logger.info("Lifespan shutdown complete")
+
+    
+
+    app = FastAPI(lifespan=lifespan)
+
+    logger = logging.getLogger("DiffusersServer.Pipelines")
+
+    if server_config.custom_model:
+        if server_config.constructor_pipeline is None:
+            raise ValueError("constructor_pipeline cannot be None - a valid pipeline constructor is required")
+
+        initializer = server_config.constructor_pipeline(
+            model_path=server_config.model,
+            pipeline=server_config.custom_pipeline,
+            torch_dtype=server_config.torch_dtype,
+            components=server_config.components,
+        )
+        model_pipeline = initializer.start()
+        request_pipe = None
+        pipeline_lock = threading.Lock()
+
+    else:
+        initializer = ModelPipelineInitializer(
+            model=server_config.model,
+            type_models=server_config.type_models,
+        )
+        model_pipeline = initializer.initialize_pipeline()
+        model_pipeline.start()
+
+        request_pipe = RequestScopedPipeline(model_pipeline.pipeline)
+        pipeline_lock = threading.Lock()
+
+    logger.info(f"Pipeline initialized and ready to receive requests (model ={server_config.model})")
+
+    app.state.MODEL_INITIALIZER = initializer
+    app.state.MODEL_PIPELINE = model_pipeline
+    app.state.REQUEST_PIPE = request_pipe
+    app.state.PIPELINE_LOCK = pipeline_lock
 
     class JSONBodyQueryAPI(BaseModel):
         model : str | None = None
@@ -135,54 +224,12 @@ class JSONBodyQueryAPI(BaseModel):
         num_inference_steps : int = 28
         num_images_per_prompt : int = 1
 
-    logging.basicConfig(level=logging.INFO)
-    global logger
-    logger = logging.getLogger(__name__)
-
-    server_config = config or ServerConfigModels()
-    app.state.SERVER_CONFIG = server_config
-
-    global utils_app
-
-    utils_app = Utils(host=server_config.host, port=server_config.port)
-
-    logger.info(f"Inicializando pipeline para el modelo: {server_config.model}")
-    try:
-        if server_config.custom_model:
-            if server_config.constructor_pipeline is None:
-                raise ValueError("constructor_pipeline cannot be None - a valid pipeline constructor is required")
-            initializer = server_config.constructor_pipeline(
-                model_path=server_config.model,
-                pipeline=server_config.custom_pipeline,
-                torch_dtype=server_config.torch_dtype,
-                components=server_config.components,
-            )
-            model_pipeline = initializer.start()
-            app.state.CUSTOM_PIPELINE = server_config.custom_pipeline
-            app.state.MODEL_PIPELINE = model_pipeline
-            app.state.MODEL_INITIALIZER = initializer
-            logger.info(f"Pipeline personalizado inicializado. Tipo: {type(model_pipeline)}")
-        else:
-            initializer = ModelPipelineInitializer(
-                model=server_config.model,
-                type_models=server_config.type_models,
-            )
-            model_pipeline = initializer.initialize_pipeline()
-            model_pipeline.start()
-
-            app.state.REQUEST_PIPE = RequestScopedPipeline(model_pipeline.pipeline)
-
-            # Lock for concurrency
-            pipeline_lock = threading.Lock()
-
-            app.state.MODEL_PIPELINE = model_pipeline
-            app.state.PIPELINE_LOCK = pipeline_lock
-            app.state.MODEL_INITIALIZER = initializer
-
-        logger.info("Pipeline initialized and ready to receive requests")
-    except Exception as e:
-        logger.error(f"Error initializing pipeline: {e}")
-        raise
+    @app.middleware("http")
+    async def count_requests_middleware(request: Request, call_next):
+        async with app.state.metrics_lock:
+            app.state.total_requests += 1
+        response = await call_next(request)
+        return response
 
 
     @app.get("/")
@@ -196,14 +243,16 @@ async def api(json: JSONBodyQueryAPI):
         num_steps             = json.num_inference_steps
         num_images_per_prompt = json.num_images_per_prompt
 
-        wrapper     = app.state.MODEL_PIPELINE
+        wrapper     = app.state.MODEL_PIPELINE   
         initializer = app.state.MODEL_INITIALIZER
 
+        utils_app = app.state.utils_app
+
 
         if not wrapper or not wrapper.pipeline:
-            raise HTTPException(500, "Modelo no inicializado correctamente")
+            raise HTTPException(500, "Model not initialized correctly")
         if not prompt.strip():
-            raise HTTPException(400, "No se proporcionó prompt")
+            raise HTTPException(400, "No prompt provided")
 
         def make_generator():
             g = torch.Generator(device=initializer.device)
@@ -212,9 +261,6 @@ def make_generator():
         req_pipe = app.state.REQUEST_PIPE
 
         def infer():
-            # This is called that because the RequestScoped Pipeline already internally 
-            # handles everything necessary for inference and only the 
-            # model pipeline needs to be passed, for example StableDiffusion3Pipeline
             gen = make_generator()
             return req_pipe.generate(
                 prompt=prompt,
@@ -226,14 +272,22 @@ def infer():
             )
 
         try:
+            async with app.state.metrics_lock:
+                app.state.active_inferences += 1
+
             output = await run_in_threadpool(infer)
 
+            async with app.state.metrics_lock:
+                app.state.active_inferences = max(0, app.state.active_inferences - 1)
+
             urls = [utils_app.save_image(img) for img in output.images]
             return {"response": urls}
 
         except Exception as e:
-            logger.error(f"Error durante la inferencia: {e}")
-            raise HTTPException(500, f"Error en procesamiento: {e}")
+            async with app.state.metrics_lock:
+                app.state.active_inferences = max(0, app.state.active_inferences - 1)
+            logger.error(f"Error during inference: {e}")
+            raise HTTPException(500, f"Error in processing: {e}")
 
         finally:
             import gc; gc.collect()
@@ -243,6 +297,7 @@ def infer():
 
     @app.get("/images/{filename}")
     async def serve_image(filename: str):
+        utils_app = app.state.utils_app
         file_path = os.path.join(utils_app.image_dir, filename)
         if not os.path.isfile(file_path):
             raise HTTPException(status_code=404, detail="Image not found")
diff --git a/examples/server-async/DiffusersServer/superpipeline.py b/examples/server-async/DiffusersServer/superpipeline.py
@@ -1,5 +1,3 @@
-# from https://github.com/F4k3r22/DiffusersServer/blob/main/DiffusersServer/superpipeline.py
-
 from diffusers.pipelines import *
 from diffusers  import *
 import torch
diff --git a/examples/server-async/DiffusersServer/uvicorn_diffu.py b/examples/server-async/DiffusersServer/uvicorn_diffu.py
diff --git a/examples/server-async/requirements.txt b/examples/server-async/requirements.txt

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-# from https://github.com/F4k3r22/DiffusersServer/blob/main/DiffusersServer/create_server.py`
	`1`	`+# create_server.py`
`2`	`2`
`3`	`3`	`from .Pipelines import *`
`4`	`4`	`from .serverasync import *`
Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,3 @@`
`1`		`-# from https://github.com/F4k3r22/DiffusersServer/blob/main/DiffusersServer/superpipeline.py`
`2`		`-`
`3`	`1`	`from diffusers.pipelines import *`
`4`	`2`	`from diffusers import *`
`5`	`3`	`import torch`