OnnxRuntime GenAI Windows GPU ガイドライン

このガイドラインは、Windows上でGPUを使用してONNX Runtime (ORT) をセットアップおよび利用する手順を提供します。GPUアクセラレーションを活用してモデルのパフォーマンスと効率を向上させることを目的としています。

本書では以下について説明します：

環境構築：CUDA、cuDNN、ONNX Runtimeなど必要な依存関係のインストール手順
設定：GPUリソースを効果的に利用するための環境およびONNX Runtimeの設定方法
最適化のヒント：GPU設定を微調整して最適なパフォーマンスを引き出すためのアドバイス

1. Python 3.10.x /3.11.8

注記 Python環境にはMiniforgeの使用を推奨します

conda create -n pydev python==3.11.8

conda activate pydev

Reminder もしPythonのONNXライブラリをインストールしている場合は、アンインストールしてください

2. wingetでCMakeをインストール

winget install -e --id Kitware.CMake

3. Visual Studio 2022 - C++によるデスクトップ開発をインストール

注記コンパイルしない場合はこのステップをスキップできます

4. NVIDIAドライバーのインストール

NVIDIA GPUドライバー https://www.nvidia.com/en-us/drivers/
NVIDIA CUDA 12.4 https://developer.nvidia.com/cuda-12-4-0-download-archive
NVIDIA CUDNN 9.4 https://developer.nvidia.com/cudnn-downloads

Reminder インストール時はデフォルト設定を使用してください

5. NVIDIA環境の設定

NVIDIA CUDNN 9.4のlib、bin、includeフォルダの内容をNVIDIA CUDA 12.4の対応するフォルダにコピーします

'C:\Program Files\NVIDIA\CUDNN\v9.4\bin\12.6' のファイルを 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\bin' にコピー
'C:\Program Files\NVIDIA\CUDNN\v9.4\include\12.6' のファイルを 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\include' にコピー
'C:\Program Files\NVIDIA\CUDNN\v9.4\lib\12.6' のファイルを 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\lib\x64' にコピー

6. Phi-3.5-mini-instruct-onnxのダウンロード

winget install -e --id Git.Git

winget install -e --id GitHub.GitLFS

git lfs install

git clone https://huggingface.co/microsoft/Phi-3.5-mini-instruct-onnx

7. InferencePhi35Instruct.ipynbの実行

Notebookを開いて実行してください

8. ORT GenAI GPUのコンパイル

注記

まず、onnx、onnxruntime、onnxruntime-genaiに関するすべてをアンインストールしてください

pip list

その後、すべてのonnxruntimeライブラリをアンインストールします。例：

pip uninstall onnxruntime

pip uninstall onnxruntime-genai

pip uninstall onnxruntume-genai-cuda

Visual Studio拡張機能のサポートを確認

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras にアクセスし、C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integration が存在するか確認してください。

見つからない場合は、他のCudaツールキットのドライバーフォルダを確認し、visual_studio_integrationフォルダとその内容をC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integrationにコピーしてください

コンパイルしない場合はこのステップをスキップできます

git clone https://github.com/microsoft/onnxruntime-genai

https://github.com/microsoft/onnxruntime/releases/download/v1.19.2/onnxruntime-win-x64-gpu-1.19.2.zip をダウンロード
onnxruntime-win-x64-gpu-1.19.2.zipを解凍し、フォルダ名をortに変更してonnxruntime-genaiにコピー
Windows TerminalでVS 2022のDeveloper Command Promptを開き、onnxruntime-genaiに移動

Python環境でコンパイルを実行

cd onnxruntime-genai

python build.py --use_cuda  --cuda_home "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4" --config Release


cd build/Windows/Release/Wheel

pip install .whl

免責事項：
本書類はAI翻訳サービス「Co-op Translator」を使用して翻訳されました。正確性を期しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。原文の言語によるオリジナル文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。本翻訳の利用により生じたいかなる誤解や誤訳についても、当方は一切の責任を負いかねます。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

OnnxRuntime GenAI Windows GPU ガイドライン

1. Python 3.10.x /3.11.8

2. wingetでCMakeをインストール

3. Visual Studio 2022 - C++によるデスクトップ開発をインストール

4. NVIDIAドライバーのインストール

5. NVIDIA環境の設定

6. Phi-3.5-mini-instruct-onnxのダウンロード

7. InferencePhi35Instruct.ipynbの実行

8. ORT GenAI GPUのコンパイル

FilesExpand file tree

ORTWindowGPUGuideline.md

Latest commit

History

ORTWindowGPUGuideline.md

File metadata and controls

OnnxRuntime GenAI Windows GPU ガイドライン

1. Python 3.10.x /3.11.8

2. wingetでCMakeをインストール

3. Visual Studio 2022 - C++によるデスクトップ開発をインストール

4. NVIDIAドライバーのインストール

5. NVIDIA環境の設定

6. Phi-3.5-mini-instruct-onnxのダウンロード

7. InferencePhi35Instruct.ipynbの実行

8. ORT GenAI GPUのコンパイル