Ta navodila opisujejo korake za nastavitev in uporabo ONNX Runtime (ORT) z GPU-ji na Windows. Namenjena so, da vam pomagajo izkoristiti pospeševanje z GPU za vaše modele, kar izboljša zmogljivost in učinkovitost.
Dokument vsebuje navodila za:
- Nastavitev okolja: Navodila za namestitev potrebnih odvisnosti, kot so CUDA, cuDNN in ONNX Runtime.
- Konfiguracijo: Kako nastaviti okolje in ONNX Runtime za učinkovito uporabo GPU virov.
- Nasvete za optimizacijo: Priporočila za fino nastavitev GPU nastavitev za optimalno delovanje.
Note Priporočamo uporabo miniforge kot vaše Python okolje
conda create -n pydev python==3.11.8
conda activate pydev
Reminder Če imate nameščeno katerokoli Python ONNX knjižnico, jo prosim odstranite
winget install -e --id Kitware.CMake
Note Če ne želite prevajati, lahko ta korak preskočite
-
NVIDIA GPU Driver https://www.nvidia.com/en-us/drivers/
-
NVIDIA CUDA 12.4 https://developer.nvidia.com/cuda-12-4-0-download-archive
-
NVIDIA CUDNN 9.4 https://developer.nvidia.com/cudnn-downloads
Reminder Prosimo, uporabite privzete nastavitve med namestitvijo
Kopirajte NVIDIA CUDNN 9.4 datoteke iz map lib, bin, include v ustrezne mape NVIDIA CUDA 12.4
-
kopirajte datoteke iz 'C:\Program Files\NVIDIA\CUDNN\v9.4\bin\12.6' v 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\bin'
-
kopirajte datoteke iz 'C:\Program Files\NVIDIA\CUDNN\v9.4\include\12.6' v 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\include'
-
kopirajte datoteke iz 'C:\Program Files\NVIDIA\CUDNN\v9.4\lib\12.6' v 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\lib\x64'
winget install -e --id Git.Git
winget install -e --id GitHub.GitLFS
git lfs install
git clone https://huggingface.co/microsoft/Phi-3.5-mini-instruct-onnx
Odprite Notebook in ga zaženite
Note
- Najprej odstranite vse pakete, povezane z onnx, onnxruntime in onnxruntime-genai
pip list
Nato odstranite vse onnxruntime knjižnice, npr.
pip uninstall onnxruntime
pip uninstall onnxruntime-genai
pip uninstall onnxruntume-genai-cuda
- Preverite podporo Visual Studio Extension
Preverite mapo C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras, da zagotovite, da obstaja C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integration.
Če ni najdena, preverite druge mape Cuda toolkit gonilnikov in kopirajte mapo visual_studio_integration ter njeno vsebino v C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integration
- Če ne želite prevajati, lahko ta korak preskočite
git clone https://github.com/microsoft/onnxruntime-genai
-
Razširite onnxruntime-win-x64-gpu-1.19.2.zip, preimenujte mapo v ort in jo kopirajte v onnxruntime-genai
-
Uporabite Windows Terminal, odprite Developer Command Prompt za VS 2022 in pojdite v onnxruntime-genai
- Prevedite z vašim Python okoljem
cd onnxruntime-genai
python build.py --use_cuda --cuda_home "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4" --config Release
cd build/Windows/Release/Wheel
pip install .whl
Omejitev odgovornosti:
Ta dokument je bil preveden z uporabo AI prevajalske storitve Co-op Translator. Čeprav si prizadevamo za natančnost, vas opozarjamo, da avtomatizirani prevodi lahko vsebujejo napake ali netočnosti. Izvirni dokument v njegovem izvirnem jeziku velja za avtoritativni vir. Za ključne informacije priporočamo strokovni človeški prevod. Za morebitna nesporazume ali napačne interpretacije, ki izhajajo iz uporabe tega prevoda, ne odgovarjamo.


