update readme

shell-nlp · shell-nlp · commit 58d73d139100 · 2025-09-08T01:00:12.000+08:00
diff --git a/README.md b/README.md
@@ -14,7 +14,7 @@
 
 本项目依托fastchat的基础能力来提供**openai server**的能力.
 
-1. 支持**Chat**、**Embedding**、**ReRanker**、**text-moderation（文本审核，分类）**、**ASR**、**TTS（支持声音克隆）**、 **SD(Stable Diffusion,文生图)** 模型的 **openai**规范 接口服务。
+1. 支持**Chat**、**Embedding**、**ReRanker**、**text-moderation（文本审核，分类）**、**ASR**、**TTS（支持声音克隆）**、**SD(Stable Diffusion,文生图、文生视频、图片编辑、)** 模型的 **openai**规范 接口服务。
 2. 支持**HF**、**vLLM**、**LMDeploy**和**SGLang** 多种加速推理后端引擎。
 3. 多个模型共用**openai server**的同一个端口进行调用，自动进行模型调度。
 
@@ -31,6 +31,7 @@
 | 📱  | **ASR(语音转文本)**    | 支持基于`FunASR`的ASR模型                                        |
 | 🔊  | **TTS(文本转语音)**   | 支持基于`SparkTTS`的TTS模型，支持基于`vLLM`、`SGLang`后端对齐加速，`RTF<<1`,支持流式音频流输出                                          |
 | 🖌️  | **SD(Stable Diffusion,文生图)**    | 支持基于`diffusers`的 `文生图` 模型                                        |
+| 🏔️  | **SD(Stable Diffusion,图片编辑)**    | 支持基于`diffusers`的 `图片编辑` 模型                                        |
 | 🔄  | **支持LM/VL模型**  | 支持多种大语言模型或多模态语言模型                                              |
 | 🎭  | **推理服务性能测试**   | 基于`Evalscope`实现`Throughput`、`TTFT`、`TPOT`等服务性能指标                                                  |
 
@@ -44,6 +45,7 @@
 - 全球唯一支持了**openai**库的TTS模型接口（tts, /v1/audio/speech）(代码样例见gpt_server/tests/test_openai_tts_stream.py)
 - 全球唯一支持了**openai**库的ASR模型接口（asr, /v1/audio/transcriptions）,基于fanasr后端(代码样例见gpt_server/tests/test_openai_transcriptions.py)
 - 全球唯一支持了**openai**库的SD,文生图模型接口（sd, /v1/images/generations）,基于diffusers后端(代码样例见gpt_server/tests/test_image_gen.py)
+- - 全球唯一支持了**openai**库的SD,文生图模型接口（sd, /v1/images/edits）,基于diffusers后端(代码样例见gpt_server/tests/test_image_edit.py)
 
 ## 🖼️ 配置文档
 通过这个样例文件，可以很快的掌握项目的配置方式。
@@ -55,6 +57,7 @@
 <summary><b>2025</b></summary>
  
 ```plaintext
+2025-9-7   支持了 文本编辑模型 (代码样例见gpt_server/tests/test_image_edit.py)
 2025-8-8   初步支持了 embedding 的 vllm 加速
 2025-6-17  支持了 jina-reranker-m0 全球首个支持多模态多语言的重排模型
 2025-6-12  支持了 文生图模型 flux (代码样例见gpt_server/tests/test_image_gen.py)
diff --git a/gpt_server/model_worker/base/model_worker_base.py b/gpt_server/model_worker/base/model_worker_base.py
@@ -256,6 +256,8 @@ def run(cls):
         parser.add_argument("--task_type", type=str, default="auto")
         # limit_worker_concurrency
         parser.add_argument("--limit_worker_concurrency", type=int, default=1024)
+        # port
+        parser.add_argument("--port", type=int, default=None)
         args = parser.parse_args()
         os.environ["num_gpus"] = str(args.num_gpus)
         if args.backend == "vllm":
@@ -288,12 +290,13 @@ def run(cls):
         logger.remove(0)
         log_level = os.getenv("log_level", "WARNING")
         logger.add(sys.stderr, level=log_level)
-        
 
         host = args.host
         controller_address = args.controller_address
-
-        port = get_free_tcp_port()
+        if args.port:
+            port = args.port
+        else:
+            port = get_free_tcp_port()
         os.environ["WORKER_PORT"] = str(port)
         os.environ["WORKER_HOST"] = str(local_ip)
         worker_addr = f"http://{host}:{port}"
diff --git a/gpt_server/script/config_example.yaml b/gpt_server/script/config_example.yaml
@@ -195,6 +195,7 @@ models:
     model_type: qwen_image_edit
     work_mode: hf
     device: gpu
+    port: 8084 # 支持手动设置端口
     workers:
     - gpus:
       - 7
diff --git a/gpt_server/utils.py b/gpt_server/utils.py
@@ -239,6 +239,7 @@ def start_model_worker(config: dict):
                         CUDA_VISIBLE_DEVICES = ""
                     else:
                         raise Exception("目前仅支持 CPU/GPU设备!")
+                    port = model_config.get("port", None)
                     backend = model_config["work_mode"]
                     if model_type == "embedding":
                         assert backend in embedding_backend_type
@@ -264,6 +265,8 @@ def start_model_worker(config: dict):
                         + f" --limit_worker_concurrency {limit_worker_concurrency}"  # 限制worker并发数
                     )
                     # 处理为 None的情况
+                    if port:
+                        cmd += f" --port {port}"
                     if lora:
                         cmd += f" --lora '{json.dumps(lora)}'"
                     if max_model_len:
diff --git a/uv.lock b/uv.lock