Skip to content

Latest commit

 

History

History
67 lines (36 loc) · 4.75 KB

File metadata and controls

67 lines (36 loc) · 4.75 KB

Nvidia JetsonでのPhi-3推論

Nvidia JetsonはNvidiaが提供する組み込みコンピューティングボードのシリーズです。Jetson TK1、TX1、TX2の各モデルには、ARMアーキテクチャのCPUを統合したNvidia製のTegraプロセッサ(またはSoC)が搭載されています。Jetsonは低消費電力システムであり、機械学習アプリケーションの高速化を目的としています。Nvidia Jetsonは、あらゆる業界で画期的なAI製品を開発するプロの開発者や、実践的なAI学習や素晴らしいプロジェクト作成を行う学生や愛好家に利用されています。SLMはJetsonのようなエッジデバイスに展開され、産業向けの生成AIアプリケーションシナリオのより良い実装を可能にします。

NVIDIA Jetsonへの展開:

自律ロボットや組み込みデバイスの開発者はPhi-3 Miniを活用できます。Phi-3は比較的小型で、エッジ展開に最適です。トレーニング中にパラメータが綿密に調整されており、高精度な応答が保証されています。

TensorRT-LLM最適化:

NVIDIAのTensorrt-LLMライブラリは大規模言語モデルの推論を最適化します。Phi-3 Miniの長いコンテキストウィンドウをサポートし、スループットとレイテンシの両方を向上させます。最適化にはLongRoPE、FP8、インフライトバッチ処理などの技術が含まれます。

利用可能性と展開:

開発者は128Kコンテキストウィンドウを持つPhi-3 MiniをNVIDIAのAIページで試すことができます。これは標準APIを備えたマイクロサービスであるNVIDIA NIMとしてパッケージ化されており、どこにでも展開可能です。さらに、GitHub上のTensorRT-LLM実装も利用できます。

1. 準備

a. Jetson Orin NX / Jetson NX

b. JetPack 5.1.2+

c. Cuda 11.8

d. Python 3.8+

2. JetsonでのPhi-3実行

OllamaまたはLlamaEdgeを選択できます。

クラウドとエッジデバイスの両方でggufを使いたい場合、LlamaEdgeはWasmEdgeとして理解できます(WasmEdgeはクラウドネイティブ、エッジ、分散アプリケーションに適した軽量で高性能、スケーラブルなWebAssemblyランタイムです。サーバーレスアプリケーション、組み込み関数、マイクロサービス、スマートコントラクト、IoTデバイスをサポートします)。LlamaEdgeを通じてggufの量子化モデルをエッジデバイスやクラウドに展開可能です。

llamaedge

使用手順は以下の通りです。

  1. 関連ライブラリとファイルをインストール・ダウンロードする
curl -sSf https://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh | bash -s -- --plugin wasi_nn-ggml

curl -LO https://github.com/LlamaEdge/LlamaEdge/releases/latest/download/llama-api-server.wasm

curl -LO https://github.com/LlamaEdge/chatbot-ui/releases/latest/download/chatbot-ui.tar.gz

tar xzf chatbot-ui.tar.gz

注意: llama-api-server.wasmとchatbot-uiは同じディレクトリに置く必要があります。

  1. ターミナルでスクリプトを実行する
wasmedge --dir .:. --nn-preload default:GGML:AUTO:{Your gguf path} llama-api-server.wasm -p phi-3-chat

実行結果は以下の通りです。

llamaedgerun

サンプルコード Phi-3 mini WASM Notebook Sample

まとめると、Phi-3 Miniは効率性、コンテキスト認識、NVIDIAの最適化技術を融合した言語モデルの飛躍的進歩を示しています。ロボットやエッジアプリケーションの構築において、Phi-3 Miniは注目すべき強力なツールです。

免責事項
本書類はAI翻訳サービス「Co-op Translator」を使用して翻訳されました。正確性を期しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。原文の言語によるオリジナル文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。本翻訳の利用により生じた誤解や誤訳について、当方は一切の責任を負いかねます。