启动 REST API 服务,提供 Ollama 兼容的 HTTP API。
csghub-lite serve [flags]| 选项 | 说明 | 默认值 |
|---|---|---|
--listen <addr> |
监听地址 | :11435(来自配置文件) |
启动后,服务器提供以下 API 端点:
- 对话生成(
/api/chat、/api/generate) - 模型管理(
/api/tags、/api/show、/api/pull、/api/delete) - 服务管理(
/api/ps、/api/stop、/api/health)
详见 REST API 参考。
服务器在首次请求时自动加载模型,后续请求复用已加载的模型实例。
使用 Ctrl+C 优雅关闭服务器(会自动释放所有模型资源)。
# 使用默认端口
csghub-lite serve
# 指定端口
csghub-lite serve --listen :8080
# 后台运行
csghub-lite serve &