KServe Compatible Demo Model Server For Seq2Seq Models

This is a demo model server that can run inside Openshift AI as a KServe model server. It exposes a way to perform inference with a Sequence to Sequence model (such as T5) running in the backend.

It is a companion project to the finetuning example found here

Parameters

The server expects a JSON-encoded payload to start inference.

For v1 compatible requests:

 // example v1 payload:
 {
   "instances": [
     {
       "task": "anonymize",
       "source": "text string to be anonymized",
     }
   ]
 }

For v2 compatible requests:

{
  "inputs": [
    {
      "name": "anonymize",
      "shape": [1],
      "datatype": "BYTES",
      "data": ["text string to be anonymized"]
    },
  ]
}

How to run

$ uv sync
$ MODEL_ID="path to the finetuned checkpoint" uv run model.py --model_name flant5-finetuned

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
libs		libs
manifests		manifests
.gitignore		.gitignore
.python-version		.python-version
Containerfile		Containerfile
LICENSE		LICENSE
README.md		README.md
model.py		model.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

KServe Compatible Demo Model Server For Seq2Seq Models

Parameters

How to run

About

Uh oh!

Releases

Packages

Languages

License

mcaimi/flan-t5-custom-kserve-engine

Folders and files

Latest commit

History

Repository files navigation

KServe Compatible Demo Model Server For Seq2Seq Models

Parameters

How to run

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages