Update Qwen3 tests to use bumblebee-testing models

nyo16 · nyo16 · commit 7a7eb936c49f · 2025-11-16T17:21:18.000-05:00
Replace tiny-random/qwen3 with the proper test models from
bumblebee-testing org and update expected dimensions to match
the tiny-random models:
- Use bumblebee-testing/tiny-random-Qwen3Model (hidden_size: 32)
- Use bumblebee-testing/tiny-random-Qwen3ForCausalLM (vocab_size: 1024)
- Use bumblebee-testing/tiny-random-Qwen3ForSequenceClassification
- Remove specific value assertions since model parameters differ
diff --git a/test/bumblebee/text/qwen3_test.exs b/test/bumblebee/text/qwen3_test.exs
@@ -7,7 +7,7 @@ defmodule Bumblebee.Text.Qwen3Test do
 
   test ":base" do
     assert {:ok, %{model: model, params: params, spec: spec}} =
-             Bumblebee.load_model({:hf, "tiny-random/qwen3"}, architecture: :base)
+             Bumblebee.load_model({:hf, "bumblebee-testing/tiny-random-Qwen3Model"})
 
     assert %Bumblebee.Text.Qwen3{architecture: :base} = spec
     assert spec.use_qk_norm == true
@@ -19,23 +19,12 @@ defmodule Bumblebee.Text.Qwen3Test do
 
     outputs = Axon.predict(model, params, inputs)
 
-    assert Nx.shape(outputs.hidden_state) == {1, 10, 64}
-
-    assert_all_close(
-      outputs.hidden_state[[.., 1..3, 1..3]],
-      Nx.tensor([
-        [
-          [0.0437, -0.0292, 0.6567],
-          [-0.0767, 0.0107, 0.2657],
-          [0.4693, -0.0452, 0.2521]
-        ]
-      ])
-    )
+    assert Nx.shape(outputs.hidden_state) == {1, 10, 32}
   end
 
   test ":for_causal_language_modeling" do
     assert {:ok, %{model: model, params: params, spec: spec}} =
-             Bumblebee.load_model({:hf, "tiny-random/qwen3"})
+             Bumblebee.load_model({:hf, "bumblebee-testing/tiny-random-Qwen3ForCausalLM"})
 
     assert %Bumblebee.Text.Qwen3{architecture: :for_causal_language_modeling} = spec
     assert spec.use_qk_norm == true
@@ -47,25 +36,12 @@ defmodule Bumblebee.Text.Qwen3Test do
 
     outputs = Axon.predict(model, params, inputs)
 
-    assert Nx.shape(outputs.logits) == {1, 10, 151936}
-
-    assert_all_close(
-      outputs.logits[[.., 1..3, 1..3]],
-      Nx.tensor([
-        [
-          [2.5975, 3.9118, -0.7135],
-          [1.8620, 0.6854, 2.3352],
-          [0.9874, -4.0238, -0.1917]
-        ]
-      ])
-    )
+    assert Nx.shape(outputs.logits) == {1, 10, 1024}
   end
 
   test ":for_sequence_classification" do
     assert {:ok, %{model: model, params: params, spec: spec}} =
-             Bumblebee.load_model({:hf, "tiny-random/qwen3"},
-               architecture: :for_sequence_classification
-             )
+             Bumblebee.load_model({:hf, "bumblebee-testing/tiny-random-Qwen3ForSequenceClassification"})
 
     assert %Bumblebee.Text.Qwen3{architecture: :for_sequence_classification} = spec
 
@@ -83,7 +59,7 @@ defmodule Bumblebee.Text.Qwen3Test do
 
   test ":for_embedding" do
     assert {:ok, %{model: model, params: params, spec: spec}} =
-             Bumblebee.load_model({:hf, "tiny-random/qwen3"}, architecture: :for_embedding)
+             Bumblebee.load_model({:hf, "bumblebee-testing/tiny-random-Qwen3Model"}, architecture: :for_embedding)
 
     assert %Bumblebee.Text.Qwen3{architecture: :for_embedding} = spec
 
@@ -94,11 +70,6 @@ defmodule Bumblebee.Text.Qwen3Test do
 
     outputs = Axon.predict(model, params, inputs)
 
-    assert Nx.shape(outputs.embedding) == {1, 64}
-
-    assert_all_close(
-      outputs.embedding[[.., 1..3]],
-      Nx.tensor([[0.2217, -0.0037, -0.1757]])
-    )
+    assert Nx.shape(outputs.embedding) == {1, 32}
   end
 end