AI-Hypercomputer
diff --git a/‎README.md‎
Lines changed: 6 additions & 7 deletions b/‎README.md‎
Lines changed: 6 additions & 7 deletions
diff --git a/‎inference/a3ultra/deepseek-r1-671b/sglang-serving-gke/README.md‎
Lines changed: 0 additions & 1 deletion b/‎inference/a3ultra/deepseek-r1-671b/sglang-serving-gke/README.md‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎inference/a3ultra/deepseek-r1-671b/sglang-serving-gke/values.yaml‎
Lines changed: 0 additions & 1 deletion b/‎inference/a3ultra/deepseek-r1-671b/sglang-serving-gke/values.yaml‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎inference/a3ultra/deepseek-r1-671b/vllm-serving-gke/README.md‎
Lines changed: 0 additions & 1 deletion b/‎inference/a3ultra/deepseek-r1-671b/vllm-serving-gke/README.md‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎inference/a3ultra/deepseek-r1-671b/vllm-serving-gke/values.yaml‎
Lines changed: 0 additions & 1 deletion b/‎inference/a3ultra/deepseek-r1-671b/vllm-serving-gke/values.yaml‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎inference/a3ultra/llama-3.1-405b/trtllm-inference-gke/single-node/README.md‎
Lines changed: 0 additions & 1 deletion b/‎inference/a3ultra/llama-3.1-405b/trtllm-inference-gke/single-node/README.md‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎inference/a3ultra/llama-3.1-405b/trtllm-inference-gke/single-node/values.yaml‎
Lines changed: 0 additions & 1 deletion b/‎inference/a3ultra/llama-3.1-405b/trtllm-inference-gke/single-node/values.yaml‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎src/helm-charts/a3ultra/maxtext-training/templates/maxtext-launcher-job.yaml‎
Lines changed: 2 additions & 2 deletions b/‎src/helm-charts/a3ultra/maxtext-training/templates/maxtext-launcher-job.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎src/helm-charts/a3ultra/nccl-tests/templates/nccl-tests-job.yaml‎
Lines changed: 2 additions & 2 deletions b/‎src/helm-charts/a3ultra/nccl-tests/templates/nccl-tests-job.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎src/helm-charts/a3ultra/nemo-training/templates/nemo-launcher-job.yaml‎
Lines changed: 2 additions & 2 deletions b/‎src/helm-charts/a3ultra/nemo-training/templates/nemo-launcher-job.yaml‎
Lines changed: 2 additions & 2 deletions
@@ -18,13 +18,12 @@ Welcome to the reproducible benchmark recipes repository for GPUs! This reposito
 
 ### Training benchmarks A3 Mega
 
-| Models           | GPU Machine Type | Framework | Workload Type       | Orchestrator | Link to the recipe |
-| ---------------- | ---------------- | --------- | ------------------- | ------------ | ------------------ |
-| **GPT3-175B**       | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms)    | NeMo  | Pre-training   | GKE          | [Link](./training/a3mega/gpt3-175b/nemo-pretraining-gke/README.md)              |
-| **Llama-2-7B**     | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms)    | MaxText  | Pre-training   | GKE          | [Link](./training/a3mega/llama-2-7b/maxtext-pretraining-gke/README.md)            |
-| **Llama-3-70B**     | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms)    | NeMo  | Pre-training   | GKE          | [Link](./training/a3mega/llama-3-70b/nemo-pretraining-gke/README.md)            |
-| **Llama-3.1-70B**    | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms)    | NeMo  | Pre-training   | GKE          | [Link](./training/a3mega/llama-3.1-70b/nemo-pretraining-gke/README.md)            |
-| **Mixtral-8-7B**     | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms)    | NeMo  | Pre-training   | GKE          | [Link](./training/a3mega/mixtral-8x7b/nemo-pretraining-gke/README.md)            |
+Models            | GPU Machine Type                                                                                          | Framework | Workload Type | Orchestrator | Link to the recipe
+----------------- | --------------------------------------------------------------------------------------------------------- | --------- | ------------- | ------------ | ------------------
+**GPT3-175B**     | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms) | NeMo      | Pre-training  | GKE          | [Link](./training/a3mega/gpt3-175b/nemo-pretraining-gke/README.md)
+**Llama-3-70B**   | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms) | NeMo      | Pre-training  | GKE          | [Link](./training/a3mega/llama-3-70b/nemo-pretraining-gke/README.md)
+**Llama-3.1-70B** | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms) | NeMo      | Pre-training  | GKE          | [Link](./training/a3mega/llama-3.1-70b/nemo-pretraining-gke/README.md)
+**Mixtral-8-7B**  | [A3 Mega (NVIDIA H100)](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a3-mega-vms) | NeMo      | Pre-training  | GKE          | [Link](./training/a3mega/mixtral-8x7b/nemo-pretraining-gke/README.md)
 
 ### Training benchmarks A3 Ultra
 
 
@@ -157,7 +157,6 @@ The recipe uses the helm chart to run the above steps.
     cd $RECIPE_ROOT
     helm install -f values.yaml \
     --set volumes.gcsMounts[0].bucketName=${GCS_BUCKET} \
-    --set clusterName=$CLUSTER_NAME \
     --set job.image.repository=${ARTIFACT_REGISTRY}/${SGLANG_IMAGE} \
     --set job.image.tag=${SGLANG_VERSION} \
     $USER-serving-deepseek-r1-model \
 
@@ -12,7 +12,6 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-clusterName:
 
 huggingface:
   secretName: hf-secret
 
@@ -156,7 +156,6 @@ The recipe uses the helm chart to run the above steps.
     cd $RECIPE_ROOT
     helm install -f values.yaml \
     --set volumes.gcsMounts[0].bucketName=${GCS_BUCKET} \
-    --set clusterName=$CLUSTER_NAME \
     --set job.image.repository=${ARTIFACT_REGISTRY}/${VLLM_IMAGE} \
     --set job.image.tag=${VLLM_VERSION} \
     $USER-serving-deepseek-r1-model \
 
@@ -12,7 +12,6 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-clusterName:
 
 huggingface:
   secretName: hf-secret
 
@@ -170,7 +170,6 @@ The recipe uses the helm chart to run the above steps.
     cd $RECIPE_ROOT
     helm install -f values.yaml \
     --set volumes.gcsMounts[0].bucketName=${GCS_BUCKET} \
-    --set clusterName=$CLUSTER_NAME \
     --set job.image.repository=${ARTIFACT_REGISTRY}/${TRT_LLM_IMAGE} \
     --set job.image.tag=${TRT_LLM_VERSION} \
     $USER-benchmark-llama-model \
 
@@ -12,7 +12,6 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-clusterName:
 
 huggingface:
   secretName: hf-secret
 
@@ -64,9 +64,9 @@ spec:
         {{- else }}
           [
             {"interfaceName":"eth0","network":"default"},
-            {"interfaceName":"eth1","network":"{{ $root.Values.clusterName }}-sub-1"},
+            {"interfaceName":"eth1","network":"gvnic-1"},
             {{- range  $i := until 8 }}
-            {"interfaceName":"eth{{ add 2 $i }}","network":"{{ $root.Values.clusterName }}-rdma-sub-{{ $i }}"}{{ eq $i 7 | ternary "" ","}}
+            {"interfaceName":"eth{{ add 2 $i }}","network":"rdma-{{ $i }}"}{{ eq $i 7 | ternary "" ","}}
             {{- end }}
           ]
         {{- end }}
 
@@ -56,9 +56,9 @@ spec:
         {{- else }}
           [
             {"interfaceName":"eth0","network":"default"},
-            {"interfaceName":"eth1","network":"{{ $root.Values.clusterName }}-sub-1"},
+            {"interfaceName":"eth1","network":"gvnic-1"},
             {{- range  $i := until 8 }}
-            {"interfaceName":"eth{{ add 2 $i }}","network":"{{ $root.Values.clusterName }}-rdma-sub-{{ $i }}"}{{ eq $i 7 | ternary "" ","}}
+            {"interfaceName":"eth{{ add 2 $i }}","network":"rdma-{{ $i }}"}{{ eq $i 7 | ternary "" ","}}
             {{- end }}
           ]
         {{- end }}
 
@@ -64,9 +64,9 @@ spec:
         {{- else }}
           [
             {"interfaceName":"eth0","network":"default"},
-            {"interfaceName":"eth1","network":"{{ $root.Values.clusterName }}-sub-1"},
+            {"interfaceName":"eth1","network":"gvnic-1"},
             {{- range  $i := until 8 }}
-            {"interfaceName":"eth{{ add 2 $i }}","network":"{{ $root.Values.clusterName }}-rdma-sub-{{ $i }}"}{{ eq $i 7 | ternary "" ","}}
+            {"interfaceName":"eth{{ add 2 $i }}","network":"rdma-{{ $i }}"}{{ eq $i 7 | ternary "" ","}}
             {{- end }}
           ]
         {{- end }}
Original file line number	Diff line number	Diff line change
`@@ -64,9 +64,9 @@ spec:`
`64`	`64`	`{{- else }}`
`65`	`65`	`[`
`66`	`66`	`{"interfaceName":"eth0","network":"default"},`
`67`		`- {"interfaceName":"eth1","network":"{{ $root.Values.clusterName }}-sub-1"},`
	`67`	`+ {"interfaceName":"eth1","network":"gvnic-1"},`
`68`	`68`	`{{- range $i := until 8 }}`
`69`		`- {"interfaceName":"eth{{ add 2 $i }}","network":"{{ $root.Values.clusterName }}-rdma-sub-{{ $i }}"}{{ eq $i 7 \| ternary "" ","}}`
	`69`	`+ {"interfaceName":"eth{{ add 2 $i }}","network":"rdma-{{ $i }}"}{{ eq $i 7 \| ternary "" ","}}`
`70`	`70`	`{{- end }}`
`71`	`71`	`]`
`72`	`72`	`{{- end }}`
Original file line number	Diff line number	Diff line change
`@@ -56,9 +56,9 @@ spec:`
`56`	`56`	`{{- else }}`
`57`	`57`	`[`
`58`	`58`	`{"interfaceName":"eth0","network":"default"},`
`59`		`- {"interfaceName":"eth1","network":"{{ $root.Values.clusterName }}-sub-1"},`
	`59`	`+ {"interfaceName":"eth1","network":"gvnic-1"},`
`60`	`60`	`{{- range $i := until 8 }}`
`61`		`- {"interfaceName":"eth{{ add 2 $i }}","network":"{{ $root.Values.clusterName }}-rdma-sub-{{ $i }}"}{{ eq $i 7 \| ternary "" ","}}`
	`61`	`+ {"interfaceName":"eth{{ add 2 $i }}","network":"rdma-{{ $i }}"}{{ eq $i 7 \| ternary "" ","}}`
`62`	`62`	`{{- end }}`
`63`	`63`	`]`
`64`	`64`	`{{- end }}`