Oneflow-Inc
diff --git a/‎CMakeLists.txt‎
Lines changed: 3 additions & 3 deletions b/‎CMakeLists.txt‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎ci/build/oneflow-serving.py‎
Lines changed: 1 addition & 2 deletions b/‎ci/build/oneflow-serving.py‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎ci/build/oneflow_serving_triton_entrypoint.sh‎
Lines changed: 2 additions & 1 deletion b/‎ci/build/oneflow_serving_triton_entrypoint.sh‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎cmake/triton.cmake‎
Lines changed: 8 additions & 4 deletions b/‎cmake/triton.cmake‎
Lines changed: 8 additions & 4 deletions
diff --git a/‎docker/Dockerfile.base‎
Lines changed: 46 additions & 0 deletions b/‎docker/Dockerfile.base‎
Lines changed: 46 additions & 0 deletions
diff --git a/‎docker/Dockerfile.build_of‎
Lines changed: 17 additions & 0 deletions b/‎docker/Dockerfile.build_of‎
Lines changed: 17 additions & 0 deletions
diff --git a/‎docker/Dockerfile.serving‎
Lines changed: 86 additions & 0 deletions b/‎docker/Dockerfile.serving‎
Lines changed: 86 additions & 0 deletions
diff --git a/‎examples/cat.jpg‎
523 KB b/‎examples/cat.jpg‎
523 KB
diff --git a/‎examples/resnet50/client.py‎ ‎examples/client.py‎examples/resnet50/client.py renamed to examples/client.py
Lines changed: 3 additions & 3 deletions b/‎examples/resnet50/client.py‎ ‎examples/client.py‎examples/resnet50/client.py renamed to examples/client.py
Lines changed: 3 additions & 3 deletions
diff --git a/‎examples/resnet50/1/.gitkeep‎ ‎examples/cpp/resnet50/1/.gitkeep‎examples/resnet50/1/.gitkeep renamed to examples/cpp/resnet50/1/.gitkeep b/‎examples/resnet50/1/.gitkeep‎ ‎examples/cpp/resnet50/1/.gitkeep‎examples/resnet50/1/.gitkeep renamed to examples/cpp/resnet50/1/.gitkeep
@@ -20,10 +20,10 @@ option(TRITON_ENABLE_GPU "Enable GPU support in backend" ON)
 option(TRITON_ENABLE_STATS "Include statistics collections in backend" ON)
 
 set(THIRD_PARTY_MIRROR "" CACHE STRING "")
-set(TRITON_RELATED_REPO_TAG r21.10 CACHE STRING "Tag for triton-inference-server/(common|core|backend) repo")
+set(TRITON_RELATED_REPO_TAG r23.10 CACHE STRING "Tag for triton-inference-server/(common|core|backend) repo")
 message(STATUS ${TRITON_RELATED_REPO_TAG})
-if(NOT ${TRITON_RELATED_REPO_TAG} STREQUAL "r21.10")
-  message(FATAL_ERROR "Only support triton with tag r21.10.")
+if(NOT ${TRITON_RELATED_REPO_TAG} MATCHES "^(r21.10|r23.10)$")
+  message(FATAL_ERROR "Only support triton with tag r21.10 or r23.10.")
 endif()
 
 list(APPEND CMAKE_MODULE_PATH ${PROJECT_SOURCE_DIR}/cmake)
 
@@ -102,7 +102,7 @@ def __init__(self) -> None:
     def prepare(self):
         self._parse()
 
-        self._unknown.extend(['--strict-model-config', 'false'])
+        self._unknown.extend(['--disable-auto-complete-config'])
         self._unknown_split = []
         for argument in self._unknown:
             self._unknown_split.extend(argument.split('='))
@@ -116,7 +116,6 @@ def prepare(self):
             self._model_repos.append('/models')
             self._unknown.append('--model-store')
             self._unknown.append('/models')
-
         self._launch_command = 'tritonserver ' + ' '.join(self._unknown)
         self._collect_models()
         self._prepare_processor()
 
@@ -43,8 +43,9 @@ echo
 
 # This script can either be a wrapper around arbitrary command lines,
 # or it will simply exec bash if no arguments were given
+export PYTHONPATH=/opt/oneflow/python:$PYTHONPATH
 if [[ $# -eq 0 ]]; then
-  exec oneflow-serving --model-store /models --strict-model-config false
+  exec oneflow-serving --model-store /models
 else
   exec "$@"
 fi
@@ -11,11 +11,15 @@ if(DEFINED THIRD_PARTY_MIRROR)
 endif()
 
 if(${TRITON_RELATED_REPO_TAG} STREQUAL "r21.10")
-    set(REPO_COMMON_MD5 72bf32b638fe6a9e9877630cb099fc1a)
-    set(REPO_CORE_MD5 59d97b3e5d40ea58c9f685b6ecb0771a)
-    set(REPO_BACKEND_MD5 2ae374cf913fc5b348b6552858fb7e7b)
+  set(REPO_COMMON_MD5 72bf32b638fe6a9e9877630cb099fc1a)
+  set(REPO_CORE_MD5 59d97b3e5d40ea58c9f685b6ecb0771a)
+  set(REPO_BACKEND_MD5 2ae374cf913fc5b348b6552858fb7e7b)
+elseif(${TRITON_RELATED_REPO_TAG} STREQUAL "r23.10")
+  set(REPO_COMMON_MD5 8183efa82f41c4964c26e9b839ef2760)
+  set(REPO_CORE_MD5 ba92d1b9aa5154edb26fc9664224f9ae)
+  set(REPO_BACKEND_MD5 c7a6a21353e8f00e61bd97afd8708c0a)
 else()
-  message(FATAL_ERROR "Only support triton with tag r21.10.")
+  message(FATAL_ERROR "Only support triton with tag r21.10 or r23.10.")
 endif()
 
 
 
@@ -0,0 +1,46 @@
+FROM nvcr.io/nvidia/tritonserver:23.10-py3-min
+
+ENV DEBIAN_FRONTEND=noninteractive
+
+RUN APT_INSTALL="apt-get install -y --no-install-recommends" && \
+    sed -i 's/archive.ubuntu.com/mirrors.ustc.edu.cn/g' /etc/apt/sources.list && \
+    apt-get update && \
+    $APT_INSTALL \
+    build-essential \
+    apt-utils \
+    ca-certificates \
+    wget \
+    git \
+    vim \
+    libssl-dev \
+    curl \
+    unzip \
+    unrar \
+    libgl1-mesa-glx \
+    libglib2.0-0 \
+    libmkl-full-dev \
+    nasm \
+    ccache \
+    lld \
+    binutils-dev \
+    software-properties-common \
+    libb64-0d \
+    libb64-dev \
+    libre2-9 \
+    libre2-dev \
+    rapidjson-dev
+
+RUN wget https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh && \
+    bash ./Miniconda3-latest-Linux-x86_64.sh -b -p /miniconda3 && \
+    /miniconda3/bin/python -m pip config set global.index-url https://mirrors.bfsu.edu.cn/pypi/web/simple && \
+    /miniconda3/bin/conda create -n py310 python=3.10.12 -y && \
+    PIP_INSTALL="/miniconda3/envs/py310/bin/python -m pip --no-cache-dir install --upgrade" && \
+    $PIP_INSTALL cmake \
+    ninja && \
+    ln -s /miniconda3/etc/profile.d/conda.sh /etc/profile.d/conda.sh && \
+    echo ". /miniconda3/etc/profile.d/conda.sh" >> ~/.bashrc && \
+    echo "conda activate py310" >> ~/.bashrc && \
+    find /miniconda3/ -follow -type f -name '*.a' -delete && \
+    find /miniconda3/ -follow -type f -name '*.js.map' -delete && \
+    /miniconda3/bin/conda clean -afy && \
+    rm -f ./Miniconda3-latest-Linux-x86_64.sh
@@ -0,0 +1,17 @@
+FROM serving:base
+
+ENV PATH /miniconda3/envs/py310/bin:$PATH
+
+RUN cd /opt && \
+        git clone https://github.com/Oneflow-Inc/oneflow.git && \
+        cd /opt/oneflow && \
+        mkdir build && \
+        cd /opt/oneflow/build && \
+        cmake -C /opt/oneflow/cmake/caches/ci/serving/cuda-75.cmake \
+        -DCMAKE_EXE_LINKER_FLAGS_INIT="-fuse-ld=lld" \
+        -DCMAKE_MODULE_LINKER_FLAGS_INIT="-fuse-ld=lld" \
+        -DCMAKE_SHARED_LINKER_FLAGS_INIT="-fuse-ld=lld" \
+        -DBUILD_HWLOC=OFF \
+        -DWITH_MLIR_CUDA_CODEGEN=ON \
+        -DCMAKE_CUDA_ARCHITECTURES="75;86" /opt/oneflow && \
+        ninja -j32
@@ -0,0 +1,86 @@
+FROM serving:build_of as build_of
+FROM nvcr.io/nvidia/tritonserver:23.10-py3 as full
+FROM serving:base
+
+ENV PATH /miniconda3/envs/py310/bin:$PATH
+ENV PATH /opt/tritonserver/bin:${PATH}
+
+# Create a user that can be used to run triton as
+# non-root. Make sure that this user to given ID 1000. All server
+# artifacts copied below are assign to this user.
+ENV TRITON_SERVER_USER=triton-server
+RUN userdel tensorrt-server > /dev/null 2>&1 || true &&     if ! id -u $TRITON_SERVER_USER > /dev/null 2>&1 ; then         useradd $TRITON_SERVER_USER;     fi &&     [ `id -u $TRITON_SERVER_USER` -eq 1000 ] &&     [ `id -g $TRITON_SERVER_USER` -eq 1000 ]
+
+# Ensure apt-get won't prompt for selecting options
+ENV DEBIAN_FRONTEND=noninteractive
+
+RUN distribution=$(. /etc/os-release;echo $ID$VERSION_ID | sed -e 's/\.//g') && \
+    wget https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/cuda-keyring_1.0-1_all.deb && \
+    dpkg -i cuda-keyring_1.0-1_all.deb && \
+    apt-get update && \
+    apt-get install -y datacenter-gpu-manager=1:2.4.7 && \
+    rm cuda-keyring_1.0-1_all.deb
+
+WORKDIR /opt/tritonserver
+RUN rm -rf /opt/tritonserver/*
+COPY --chown=1000:1000 --from=full /opt/tritonserver/LICENSE .
+COPY --chown=1000:1000 --from=full /opt/tritonserver/TRITON_VERSION .
+COPY --chown=1000:1000 --from=full /opt/tritonserver/NVIDIA_Deep_Learning_Container_License.pdf .
+COPY --chown=1000:1000 --from=full /opt/tritonserver/bin bin/
+COPY --chown=1000:1000 --from=full /opt/tritonserver/lib lib/
+COPY --chown=1000:1000 --from=full /opt/tritonserver/include include/
+COPY --chown=1000:1000 --from=full /opt/tritonserver/backends/python backends/python/
+
+RUN cd /opt && \
+    git clone https://github.com/Oneflow-Inc/serving.git && \
+    cd /opt/serving && \
+    git checkout multi_backends && \
+    cp /opt/serving/ci/build/oneflow_serving_triton_entrypoint.sh /opt/nvidia/ && \
+    cp /opt/serving/ci/build/oneflow-serving.py /opt/tritonserver/bin/oneflow-serving && \
+    mkdir -p /opt/tritonserver/backends/oneflow_python && \
+    cp /opt/serving/src/triton_python/model.py /opt/tritonserver/backends/oneflow_python/
+
+
+COPY --chown=1000:1000 --from=build_of /opt/oneflow /opt/oneflow
+COPY --chown=1000:1000 --from=build_of /opt/oneflow/build/liboneflow_cpp /opt/liboneflow_cpp
+
+RUN apt-get install -y --no-install-recommends libunwind-dev libarchive-dev && \
+    rm /opt/oneflow/python/oneflow/core && \
+    cp -r /opt/oneflow/build/of_proto_python/oneflow/core /opt/oneflow/python/oneflow/ && \
+    rm -rf /opt/oneflow/build && \
+    /miniconda3/envs/py310/bin/python -m pip --no-cache-dir install -r /opt/oneflow/dev-requirements.txt && \
+    /miniconda3/envs/py310/bin/python -m pip --no-cache-dir install typing_extensions && \
+    echo "export PYTHONPATH=/opt/oneflow/python:$PYTHONPATH" >> ~/.bashrc
+
+RUN cd /opt && \
+    git clone https://github.com/Oneflow-Inc/oneflow-lite.git && \
+    cd /opt/oneflow-lite/runtime && \
+    mkdir build && \
+    cd /opt/oneflow-lite/runtime/build && \
+    cmake -DBUILD_X86=ON \
+    -DBUILD_CUDA=ON .. && \
+    make -j32 && \
+    make install
+
+RUN mkdir -p /opt/serving/build && \
+    cd /opt/serving/build && \
+    cmake -DCMAKE_PREFIX_PATH=/opt/liboneflow_cpp/share \
+    -DTRITON_RELATED_REPO_TAG="r23.10" \
+    -DTRITON_ENABLE_GPU=ON \
+    -DTHIRD_PARTY_MIRROR=aliyun \
+    -DBUILD_ONEFLOW_LITE_BACKEND=ON \
+    -DBUILD_ONEFLOW_BACKEND=ON \
+    -G Ninja .. && \
+    ninja -j32 && \
+    mkdir -p /opt/tritonserver/backends/oneflow && \
+    mkdir -p /opt/tritonserver/backends/oneflow_lite && \
+    mv /opt/serving/build/libtriton_oneflow.so /opt/tritonserver/backends/oneflow/ && \
+    mv /opt/serving/build/libtriton_oneflow_lite.so /opt/tritonserver/backends/oneflow_lite/ && \
+    mkdir -p /usr/local/nvidia/lib && \
+    mv /opt/liboneflow_cpp/lib/* /usr/local/nvidia/lib/ && \
+    cd /opt && \
+    rm -rf /opt/liboneflow_cpp && \
+    rm -rf /opt/oneflow_lite && \
+    rm -rf /opt/serving
+
+ENTRYPOINT ["/opt/nvidia/oneflow_serving_triton_entrypoint.sh"]
@@ -31,7 +31,7 @@
     triton_client = httpclient.InferenceServerClient(url='127.0.0.1:8000')
 
     image = Image.open(FLAGS.image)
-    image = image.resize((224, 224), Image.ANTIALIAS)
+    image = image.resize((224, 224), Image.LANCZOS)
     image = np.asarray(image)
     image = image / 255
     image = np.expand_dims(image, axis=0)
@@ -44,7 +44,7 @@
     outputs = []
     outputs.append(httpclient.InferRequestedOutput('OUTPUT_0', binary_data=True, class_count=3))
     now = time.time()
-    results = triton_client.infer("resnet50_oneflow", inputs=inputs, outputs=outputs)
-    print(time.time() - now)
+    results = triton_client.infer("resnet50", inputs=inputs, outputs=outputs)
+    print(f"time cost: {time.time() - now}s")
     output_data0 = results.as_numpy('OUTPUT_0')
     print(output_data0)