健康检查。
响应:
{"status": "ok"}列出所有已下载的本地模型。
响应:
{
"models": [
{
"name": "Qwen/Qwen3-0.6B-GGUF",
"model": "Qwen/Qwen3-0.6B-GGUF",
"size": 639466546,
"format": "gguf",
"modified_at": "2026-03-11T00:42:14.856Z"
}
]
}查看模型详细信息。
请求:
{"model": "Qwen/Qwen3-0.6B-GGUF"}响应:
{
"modelfile": "",
"details": {
"name": "Qwen/Qwen3-0.6B-GGUF",
"model": "Qwen/Qwen3-0.6B-GGUF",
"size": 639466546,
"format": "gguf",
"modified_at": "2026-03-11T00:42:14.856Z"
}
}从 CSGHub 下载模型。返回 SSE 流式进度。
请求:
{"model": "Qwen/Qwen3-0.6B-GGUF"}响应(SSE):
data: {"status":"pulling Qwen/Qwen3-0.6B-GGUF"}
data: {"status":"downloading Qwen3-0.6B-Q8_0.gguf","digest":"Qwen3-0.6B-Q8_0.gguf","total":639446688,"completed":32768}
data: {"status":"success"}
| 字段 | 说明 |
|---|---|
status |
状态描述 |
digest |
当前下载的文件名 |
total |
文件总字节数 |
completed |
已下载字节数 |
删除本地模型。
请求:
{"model": "Qwen/Qwen3-0.6B-GGUF"}响应:
{"status": "deleted"}列出服务器上当前加载并运行的模型。
响应:
{
"models": [
{
"name": "Qwen/Qwen3-0.6B-GGUF",
"model": "Qwen/Qwen3-0.6B-GGUF",
"size": 639466546,
"format": "gguf",
"expires_at": "0001-01-01T00:00:00Z"
}
]
}| 字段 | 说明 |
|---|---|
name |
模型名称 |
size |
模型大小(字节) |
format |
模型格式 |
expires_at |
到期卸载时间(零值表示永久) |
停止并卸载一个运行中的模型,释放内存和 GPU 资源。
请求:
{"model": "Qwen/Qwen3-0.6B-GGUF"}响应:
{"status": "stopped"}错误(模型未运行):
{"error": "model \"Qwen/Qwen3-0.6B-GGUF\" is not running"}